您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. C++中文分词+自动标引范例

  2. 1、合并使用停用词表和关键词表作为分词词表,应用逆向最长匹配法对所有篇名分词,给出每条篇名对应的分词结果。在屏幕上显示篇名序号、篇名、分词结果。 2、去除停用词(显示在屏幕上)。 3、利用tfx词频加权公式,计算各词的权重,在屏幕上显示每条篇名中各词的权重。 4、根据输入的阈值,确定标引词,并在屏幕上显示标引词。 5、根据输入的标引深度,确定标引词,并在屏幕上显示标引词。
  3. 所属分类:C++

    • 发布日期:2009-12-10
    • 文件大小:956416
    • 提供者:xutaozero21
  1. 向量模型-中文分词

  2. 信息检索的经典模型认为,每篇文献可以用一组有代表性的关键词即标引词集合来描述。标引词是文献中的词,其语义可以帮助理解文献的主题;因此,标引词常用于编制索引和概括文献的内容。用来描述文献内容的标引词应该是与文献内容密切相关的语词,我们可以为文献中的标引词定义一个权值(weight)来描述这种相关程度。 标引词加权原理和算法并编程实现
  3. 所属分类:其它

    • 发布日期:2008-04-21
    • 文件大小:218112
    • 提供者:JurassicMotor