您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 人民日报(北大)语料库

  2. 分词训练语料库,仅供学习和研究使用,禁止用于商业行为
  3. 所属分类:专业指导

    • 发布日期:2009-10-31
    • 文件大小:8388608
    • 提供者:xufengye256
  1. 用于分词和命名实体识别的人民日报语料库

  2. 标准的分词语料库,也可用作命名实体识别。
  3. 所属分类:C++

    • 发布日期:2010-04-15
    • 文件大小:2097152
    • 提供者:snowpku002
  1. 基于条件随机场(CRFs)的中文词性标注方法

  2. 本文提出一种基于CRFs 模型的中文词性标注方法。该方法利用CRFs 模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1 月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98. 56 %和96. 60 %。
  3. 所属分类:专业指导

    • 发布日期:2010-05-20
    • 文件大小:353280
    • 提供者:jiangtinghaha
  1. 用来中文分词评测用的北大语料库

  2. 北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
  3. 所属分类:专业指导

    • 发布日期:2010-12-01
    • 文件大小:8388608
    • 提供者:acmok
  1. 最大匹配法文本分词

  2. 基于最大匹配的正向分词和反向分词。通过与训练语料库中进行比对,来对指定文本文件进行分词。训练语料库是人民日报1998年1月的文章,训练语料库是已经分好词的
  3. 所属分类:C++

    • 发布日期:2011-12-25
    • 文件大小:7340032
    • 提供者:hzh416
  1. 汉语词频统计软件

  2. 专门对汉语词频进行强大分析统计的软件,自带词库,安装即可使用,可自动导出统计结果,并内含人民日报报纸的词频分析,值得下载
  3. 所属分类:其它

    • 发布日期:2013-08-26
    • 文件大小:14680064
    • 提供者:jc307727407
  1. ICTPOS3.0汉语词性标记集

  2. 计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;
  3. 所属分类:互联网

    • 发布日期:2014-09-04
    • 文件大小:62464
    • 提供者:beiyouyu
  1. 人民日报1998年1月中文标注语料库

  2. 人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
  3. 所属分类:专业指导

    • 发布日期:2016-11-11
    • 文件大小:10485760
    • 提供者:xudaliang_
  1. 人民日报语料库

  2. 这个语料库自带分词。
  3. 所属分类:机器学习

    • 发布日期:2017-07-29
    • 文件大小:2097152
    • 提供者:qq_20511439
  1. 哈工大信息检索研究中心同义词词林扩展版及说明

  2. ∀同义词词林扩展版 # 收录词语近 7万条, 全部按意义进 行编排, 是一部同义类词典。哈工大信息检索研究室参照多部电子词典资源, 并按照人民日报语料库中 词语的出现频度, 只保留频度不低于 3的 (小规模语料的统计结果 ) 部分词语, 剔除 14 706个罕用词 和非常用词后, 词表共包含 77 343条词语。
  3. 所属分类:机器学习

    • 发布日期:2017-09-21
    • 文件大小:1032192
    • 提供者:zhengudaoer
  1. 人民日报中文分词语料库

  2. 用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
  3. 所属分类:机器学习

    • 发布日期:2018-08-13
    • 文件大小:16777216
    • 提供者:qq_38593211
  1. 自然语言词性标注程序

  2. 汉语的分词与词性标注程序,基于C++开发,可成功运行,其中的input文件是输入文件,output为输出,有一个自己编写的头文件和一个运行文件,语料库是人民日报语料库
  3. 所属分类:C++

    • 发布日期:2018-02-04
    • 文件大小:950272
    • 提供者:sh2245237188
  1. PeoplesDailyNER-master.rar

  2. 人工智能keras深度学习使用1998年人民日报进行分类学习。 训练分词模型! 内含98年语料库。 语料库是标注过的。
  3. 所属分类:Python

    • 发布日期:2019-09-05
    • 文件大小:24117248
    • 提供者:zy0412326
  1. 分词词库_词性人民日报199801.txt

  2. 分词词库_词性人民日报199801.txt
  3. 所属分类:深度学习

    • 发布日期:2020-04-29
    • 文件大小:10485760
    • 提供者:code_fighter
  1. 1998年人民日报语料库全

  2. 1998年人民日报语料库全 可用于中文分词,词频统计,等自然语言处理领域
  3. 所属分类:其它

    • 发布日期:2013-05-03
    • 文件大小:2097152
    • 提供者:itmayue
  1. people-2014.7z

  2. NLP学习使用词库,根据人民日报整理的词库标注,包含train和test,根据日期进行了分组。改词库可作为平时练习或课设的时候使用。
  3. 所属分类:机器学习

    • 发布日期:2020-06-11
    • 文件大小:29360128
    • 提供者:Us006124
  1. 北大人民日报语料库98年1月

  2. 北大人民日报语料库98年1月,分词研究用
  3. 所属分类:专业指导

    • 发布日期:2010-08-16
    • 文件大小:512000
    • 提供者:banana0302
  1. 人民日报语料库(中文分词语料库)

  2. 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
  3. 所属分类:专业指导

    • 发布日期:2020-09-08
    • 文件大小:2097152
    • 提供者:starmoonh
  1. python实现TF-IDF算法解析

  2. TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。 同样,理论我这里不再赘述,因为和阮一峰大神早在2013年就将TF-IDF用一种非常通俗的方式讲解出来 TF-IDF与余弦相似性的应用(一):自动提取关键词 材料 1.语料库(已分好词) 2.停用词表(哈工大停用词表) 3.python3.5 语料库的准备 这里使用的语料库是《人民日报》2015年1月16日至1月18日的发表的新闻。并且在进行TFI
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:491520
    • 提供者:weixin_38729022
  1. 汉语分词标准汇总

  2. 文章目录《PFR人民日报标注语料库》词性编码表《现代汉语语料库加工规范——词语切分与词性标注》词性标记计算所 ICTCLAS 3.0汉语词性标记集形容词(1个一类,4个二类)区别词(1个一类,2个二类)连词(1个一类,1个二类)副词(1个一类)叹词(1个一类)方位词(1个一类)前缀(1个一类)后缀(1个一类)数词(1个一类,1个二类)名词 (1个一类,7个二类,5个三类)拟声词(1个一类)介词(1个一类,2个二类)量词(1个一类,2个二类)代词(1个一类,4个二类,6个三类)处所词(1个一类)时
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:288768
    • 提供者:weixin_38530202
« 12 »