您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于条件随机场(CRFs)的中文词性标注方法

  2. 本文提出一种基于CRFs 模型的中文词性标注方法。该方法利用CRFs 模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1 月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98. 56 %和96. 60 %。
  3. 所属分类:专业指导

    • 发布日期:2010-05-20
    • 文件大小:353280
    • 提供者:jiangtinghaha
  1. 用来中文分词评测用的北大语料库

  2. 北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
  3. 所属分类:专业指导

    • 发布日期:2010-12-01
    • 文件大小:8388608
    • 提供者:acmok
  1. People-pku1998.zip

  2. 该包是人民日报1998年1月-6月标注词性的完整语料,半年的,不是网上千篇一律的1月份的,该资料适用于NLP自然语言处理领域的 序列标注任务,如分词,命名实体识别、词性标注等。人民日报1998年标注语料是纯人工手动标注和校对的,比2014年标注语料准确率高很多;2014年的是没有校验的,会有很多偏差;建议以98年的这版来训练模型!本人已经对语料中的排版进行整理过,开箱即用;
  3. 所属分类:机器学习

    • 发布日期:2020-07-04
    • 文件大小:18874368
    • 提供者:wangzhen_007