您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中文词语分析一体化系统

  2. 当前主要的中文词语分析系统 哈工大统计分词系统 自动化所三元统计模型 清华大学SEGTAG系统 词典中的每一个重要的词都加上了切分标志 无条件切出qk类词;完全切分ck类词;其他无交叉歧义的切之,否则全切分。 "动态规划"和"全切分搜索+叶子评价"
  3. 所属分类:专业指导

    • 发布日期:2010-04-20
    • 文件大小:381952
    • 提供者:hovany
  1. ICTC-6

  2. N-最短路径中文词语粗分是分词过程中非常重要的一步,而原有ICTCLAS中该部分代码也是我认为最难读懂的部分,到现在还有一些方法没有弄明白,因此我几乎重写了NShortPath类。要想说明N-最短路径代码是如何工作的并不容易,所以分成两步分,本部分先说说SharpICTCLAS中1-最短路径是如何实现的,在下一篇文章中再引申到N-最短路径。1、数据表示这里我们求最短路的例子使用如下的有向图,每条边的权重已经在图中标注出来了。(图一)根据上篇文章内容,该图该可以等价于如下的二维表格表示:(图二)
  3. 所属分类:C

    • 发布日期:2008-01-21
    • 文件大小:6
    • 提供者:whydmn
  1. 中科院中文分词ictclaszyfc-v2009.zip

  2. 一、ICTCLAS简介   中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精
  3. 所属分类:嵌入式

  1. 中科院分词系统(基于入侵检测系统)

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:嵌入式

    • 发布日期:2010-11-15
    • 文件大小:9437184
    • 提供者:quhao3100590
  1. 中科院计算所ICTCLAS

  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
  3. 所属分类:C++

    • 发布日期:2011-11-10
    • 文件大小:11534336
    • 提供者:driver0926
  1. ICTCLAS 中科院 分词系统

  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过
  3. 所属分类:Java

    • 发布日期:2011-11-14
    • 文件大小:8388608
    • 提供者:lopohui1
  1. 中科院分词系统 ICTCLAS2011 JNI版(Java语言)

  2. ICTCLAS 2011,内核版本5.0,改版后分词速度更快;稳定性更高。 以往版本需要进行编码转换,统一转换成GB2312之后才能做进一步处理。系统当前版本支持GB2312、GBK、UTF-8、BIG5等编码。以上编码无需做任何转换,即可进行后续处理。用户可指定需要处理数据的具体编码(有利于提高速度)也可让系统自动识别编码。本版新增了对繁体中文即BIG5的识别处理。 本版对Windows7支持良好。支持大用户词典。
  3. 所属分类:Java

    • 发布日期:2014-03-03
    • 文件大小:8388608
    • 提供者:specialhappy
  1. 中科院分词系统ICTCLAS2015

  2. NLPIR汉语分词系统(又名ICTCLAS2015),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。
  3. 所属分类:Java

    • 发布日期:2015-06-29
    • 文件大小:51380224
    • 提供者:lipr86
  1. 中科院分词ICTCLAS5.0_JNI

  2. 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结果),基于角色标注的未登录词识别能取得高于90%召回率,其中中国人名的识别召回率接近98%,分词和词性标注处理速度为31.5KB/s。ICTCLAS
  3. 所属分类:C++

    • 发布日期:2016-06-22
    • 文件大小:8388608
    • 提供者:pang_hailong