您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. java实现的中文词性标注算法

  2. java语言实现的关于中文词性标注的问题,在Eclipse上通过编译,可运行。欢迎下载,并提出意见。
  3. 所属分类:Java

    • 发布日期:2010-01-15
    • 文件大小:677888
    • 提供者:TDreamer
  1. 1998人民日报切分语料-带有词性标注

  2. 1998人民日报切分语料-带有词性标注,用于词性标注
  3. 所属分类:C++

    • 发布日期:2010-03-07
    • 文件大小:8388608
    • 提供者:lichunwen1987
  1. 词性标注词典(Access数据库)

  2. 词性标注词典,Access数据库,中文信息处理课编写分词程序可以用到
  3. 所属分类:Access

    • 发布日期:2010-04-13
    • 文件大小:3145728
    • 提供者:li072529
  1. 基于条件随机场_CRFs_的中文词性标注方法.caj

  2. 详细介绍了条件随机场下中文标注的方法,并与最大熵,马尔可夫模型下的标注做了对比
  3. 所属分类:专业指导

    • 发布日期:2010-05-04
    • 文件大小:196608
    • 提供者:marsdrafter
  1. 基于条件随机场(CRFs)的中文词性标注方法

  2. 本文提出一种基于CRFs 模型的中文词性标注方法。该方法利用CRFs 模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1 月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98. 56 %和96. 60 %。
  3. 所属分类:专业指导

    • 发布日期:2010-05-20
    • 文件大小:353280
    • 提供者:jiangtinghaha
  1. 可训练的中文分词和词性标注系统

  2. 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写
  3. 所属分类:其它

    • 发布日期:2010-12-26
    • 文件大小:1048576
    • 提供者:dark666666
  1. perl实现的中文词性标注

  2. perl实现的中文词性标注 读入按“中国/n 人民/n”方式分好词的文件训练 再读入分词文件测试 输出标好词性的文件
  3. 所属分类:Perl

    • 发布日期:2011-06-20
    • 文件大小:5120
    • 提供者:matrixgroup
  1. 有关词性标注及中文人名、机构名识别的源代码

  2. 一个集分词、词性标注和依存句法分析的强大的工具包,能够帮助你识别中文人名、机构名。
  3. 所属分类:C++

    • 发布日期:2011-09-03
    • 文件大小:14680064
    • 提供者:haobufei
  1. 中文自动分词和词性标注

  2. 本资源包括源代码,ppt,技术报告,能够实现中文的自动分词,词性标注。代码是java编写,用eclipse工具实现。是我们自然语言的课程设计。供大家之用
  3. 所属分类:Java

    • 发布日期:2011-12-31
    • 文件大小:7340032
    • 提供者:hexiangnc
  1. 中文词性标注源码

  2. 词性标注源码,我们的源码是用C++来实现的,主要是实现了隐马尔科夫模型和维特比算法。
  3. 所属分类:Java

    • 发布日期:2012-08-26
    • 文件大小:2097152
    • 提供者:qinhanxuanyu
  1. 中文词性标注学习训练算法

  2. 中文词性标注学习训练算法,绝对可以运行,具有极高的参考价值~
  3. 所属分类:Java

    • 发布日期:2014-03-27
    • 文件大小:816128
    • 提供者:emcoder
  1. 基于隐马尔可夫模型的有监督词性标注

  2. 本项目采用java实现了一个基于隐马尔可夫模型的中文句子词性标注系统,并附有详细的说明文档,对于想了解HMM和词性标注的人都会有很大帮助。
  3. 所属分类:Java

    • 发布日期:2014-06-22
    • 文件大小:4194304
    • 提供者:yutianzuijin
  1. 多语种词性标注

  2. 词性标注工具有一个models文件夹,该文件夹下有两种类型的问价:.tagger类型和.props类型。其中.tagger类型的文件是词性标注训练出来的模型文件,.props类型是其对应的properties文件,也可给中文等其他语种标注
  3. 所属分类:Java

    • 发布日期:2015-08-21
    • 文件大小:24117248
    • 提供者:jmschentt
  1. 基于条件随机场_CRFs_的中文词性标注方法

  2. 本文提出一种基于 CRFs 模型的中文词性标注方法。该方法利用 CRFs 模型能够添加任意特征的优点 ,在使用词的上下文信息的同时 ,针对兼类词和未登录词添加了新 ...
  3. 所属分类:讲义

    • 发布日期:2016-02-18
    • 文件大小:264192
    • 提供者:u014677900
  1. 中文分词及词性标注语料

  2. 中文分词及词性标注语料,包含微软亚研院、搜狗、北京大学等的语料库
  3. 所属分类:机器学习

    • 发布日期:2017-12-18
    • 文件大小:41943040
    • 提供者:jklhj123
  1. 中文词性标注

  2. 中文词性标注的科普文章,小标记集。词性标注除了使用《现代汉语语法信息词典》中的26 个词类标记 (名词n、时间词t、处所词s、方位词f、数词m、量词q、区别词b、代词r、动词v、形 容词a、状态词z、副词d、介词p、连词c、助词u、语气词y、叹词e、拟声词o、成语i、 习用语l、简称j、前接成分h、后接成分k、语素g、非语素字x、标点符号w)外,增加 了以下3 类标记:①专有名词的分类标记,即人名nr,地名ns,团体机关单位名称nt,其 他专有名词nz;②语素的子类标记,即名语素Ng,动语素V
  3. 所属分类:机器学习

    • 发布日期:2018-04-13
    • 文件大小:302080
    • 提供者:weixin_41808886
  1. 微软亚研的中文分词、词性标注和命名实体识别语料

  2. 微软亚研的中文分词、词性标注和命名实体识别语料,包括训练和验证集,xml格式,方便使用,机器学习、信息检索以及NLP领域的研究人员使用来训练模型
  3. 所属分类:机器学习

    • 发布日期:2018-10-17
    • 文件大小:4194304
    • 提供者:u010732327
  1. 自然语言处理 中英文分词、词性标注与命名实体识别——文本和代码

  2. 中英文分词工具有很多,今天我们来使用Jieba、SnowNlp、nltk、thunlp、NLPIR、Stanford等六种工具来对给定中英文文本进行分词、词性标注与命名实体识别。
  3. 所属分类:Python

    • 发布日期:2019-05-24
    • 文件大小:7168
    • 提供者:godsolve
  1. ctbparser:ctbparser是一种用C ++语言实现的开源的中文处理工具包(GBK编码),用于分词,词性标注,依存句法分析,采用的是宾州树库(CTB)标准-源码包

  2. ctbparser ctbparser是一种用C ++语言实现的开源的中文处理工具包(GBK编码),用于分词,词性标注,依存句法分析,采用的是宾州树库(CTB)标准。
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:14680064
    • 提供者:weixin_42134144
  1. 基于SVMTool的中文词性标注

  2. SVMTool是建立在支持向量机(SVM)原理上的序列标注工具,具有简单、灵活、高效的特点,可以融入大量的语言特征。该文将SVMTool应用于中文词性标注任务,将基于隐马尔科夫模型的基线系统准确率提升了2.07%。针对未登录词准确率不高的问题,该文加入了中文字、词的特征,包括构成汉字的部首特征和词重叠特征,并从理论上分析了这两个特征的可行性,实验显示加入这些特征后,未登录词标注的准确率提升了1.16%,平均错误率下降了7.40%。
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:668672
    • 提供者:weixin_38644688
« 12 3 4 5 6 7 8 9 10 »