您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 中英文分词算法KTDictSeg

  2. * KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) * 处理速度: 600KBytes/s
  3. 所属分类:其它

    • 发布日期:2010-02-20
    • 文件大小:1039360
    • 提供者:naughty610
  1. KTDictSeg 1.2-简易分词系统

  2. 中文人名判断 正向匹配分词和反向匹配分词的选项 停用词过滤 词性标注
  3. 所属分类:C#

    • 发布日期:2007-12-18
    • 文件大小:1048576
    • 提供者:shirleygx
  1. KTDictSeg分词系统V1.3.01

  2. * KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) 代码采用 Visual Studio 2005 编译通过,需在.net framework 2.0 下运行
  3. 所属分类:其它

    • 发布日期:2010-04-27
    • 文件大小:2097152
    • 提供者:kang2004wei
  1. C# 盘古分词

  2. 1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自动更新字典功能,对超过阈值的人名和未登录词自动插入字典 需打开 AutoInsertUnknownWords 开关 并设置 Unkno
  3. 所属分类:C#

    • 发布日期:2011-10-28
    • 文件大小:3145728
    • 提供者:jaymezhang
  1. KTDictSeg 1.4.01

  2. V1.4.01 1、 增加对Asp.net的支持 2、 增加多元分词 3、 配置文件中增加对相对路径的支持(winform 和 asp.net) 4、 字典工具增加根据词性和单词长度查找功能。 5、 字典工具增加单词导出功能,用于构件停用词表。 6、 增加ASP.NET 的例子 7、 输出结果中增加词性,权重等信息 8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。
  3. 所属分类:C#

    • 发布日期:2012-02-05
    • 文件大小:2097152
    • 提供者:braight
  1. KTDictSeg_V1.3.01

  2. 基于Lucene.Net的分词工具 基于Lucene.Net的分词工具
  3. 所属分类:C#

    • 发布日期:2012-03-12
    • 文件大小:3145728
    • 提供者:wpcxyking
  1. 分词组件V2.3.1源码

  2. 分词组件V2.3.1源码 程序介绍: 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户来自51ASPX。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。 中文分词功能 中文未登录词识别 盘古分词可以对一些不在字典中的未登录词自动识别 词频优先 盘古分词可以根据词频来解决分词的歧义问题 多元分词 盘古分词提供多重输出解决分词粒度和分词精度权衡的问题 中文人名识别 输入: “张三说的确实在理” 分词结果:张三/说/
  3. 所属分类:C#

    • 发布日期:2012-05-23
    • 文件大小:6291456
    • 提供者:ss_geng
  1. KTDictSeg V1.3 版本

  2. KTDictSeg 是一个开源的C#.net编写的,分词准确率大于90%,分词速度非常快,支持人名识别,词性标注,词频判断,未登录词识别,字典管理,Lucene.net接口。http://www.cnblogs.com/eaglet/archive/2008/05/29/1209646.html
  3. 所属分类:C#

    • 发布日期:2008-07-01
    • 文件大小:3145728
    • 提供者:eaglet
  1. Lucene.net的中文分词|KTDictSeg

  2. Lucene.net中文分词资料不是很多,很早就在看肖波的KTDictSeg,觉的分词效果不错,但是没有lucene接口,看他的blog也是很长时间没有更新了 他在他的blog中提到将在下一个版本中提供对lucene的支持,我这里期待中...同时blog中提到一挥的修改版本,但是一挥的站打不开了,不知道什么原因,我刚刚看这个时间不长,查了些资料 写了下面的代码实现了KTDictSeg在Lucene.net中的调用,期待有更好的方法出现|KTDictSeg,Lucene.net的中文分词
  3. 所属分类:C#

    • 发布日期:2012-08-21
    • 文件大小:3145728
    • 提供者:puterking888
  1. PanGu4Lucene.Net 2.3.1

  2. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。
  3. 所属分类:C#

    • 发布日期:2013-03-25
    • 文件大小:5242880
    • 提供者:noya2002
  1. KTDictSeg 1.4.01_Beta版本

  2. V1.4.01 1、 增加对Asp.net的支持 2、 增加多元分词 3、 配置文件中增加对相对路径的支持(winform 和 asp.net) 4、 字典工具增加根据词性和单词长度查找功能。 5、 字典工具增加单词导出功能,用于构件停用词表。 6、 增加ASP.NET 的例子 7、 输出结果中增加词性,权重等信息 8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。
  3. 所属分类:C#

    • 发布日期:2008-10-09
    • 文件大小:2097152
    • 提供者:eaglet
  1. KTDictSeg 1.4 Beta 漏发布的SingleWords.txt文件

  2. KTDictSeg 1.4 Beta 版本漏发布了一个记录单字的文件,没有这个文件,将导致多元分词的结果不够理想。
  3. 所属分类:C#

    • 发布日期:2008-10-20
    • 文件大小:4096
    • 提供者:eaglet
  1. 中文分词技术

  2. c#开发的winform项目,网上搜集的资料。基于.net2.0的轻量级分词组件,分词效率和准确性都较高。KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法
  3. 所属分类:C#

    • 发布日期:2015-03-17
    • 文件大小:3145728
    • 提供者:txy395354170
  1. 新版盘古代码+分词词库+分词工具

  2. 新版盘古代码+分词词库+分词工具 Pan Gu Segment is a library that can segment Chinese and English words from sentence. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。
  3. 所属分类:其它

    • 发布日期:2017-10-13
    • 文件大小:1048576
    • 提供者:baidu_34303629
  1. KTDictSeg 中英文分词组件

  2. KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力主要性能指标:分词准确度:90%以上(有待专家的权威评测)处理速度: 600KBytes/s 版本: V1.0 BataCopyright(c) 2007 http://www.kaitoo.com 作者:肖波授权: 开源GPL公司网站: http://www.kaitoo.com
  3. 所属分类:C

    • 发布日期:2007-05-24
    • 文件大小:1039360
    • 提供者:xiongfenghust
  1. KTDictSeg 中英文分词组件 V1.0.01版本

  2. KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力主要性能指标:分词准确度:90%以上(有待专家的权威评测)处理速度: 600KBytes/s版本: V1.0.01 BataCopyright(c) 2007 http://www.kaitoo.com 作者:肖波授权: 开源GPL公司网站: http://www.kaitoo.com
  3. 所属分类:C

    • 发布日期:2007-05-24
    • 文件大小:1038336
    • 提供者:eaglet
  1. Lucene.net分词器

  2. 最近在看Lucene.net 发现Lucene.net的中文分词资料不是很多,很早就在看肖波的KTDictSeg,觉的分词效果不错,但是没有lucene接口,看他的blog也是很长时间没有更新了 他在他的blog中提到将在下一个版本中提供对lucene的支持,我这里期待中...同时blog中提到一挥的修改版本,但是一挥的站打不开了,不知道什么原因,我刚刚看这个时间不长,查了些资料 写了下面的代码实现了KTDictSeg在Lucene.net中的调用,期待有更好的方法出现
  3. 所属分类:C#

    • 发布日期:2009-02-11
    • 文件大小:3145728
    • 提供者:xystop2005
  1. 盘古代码+分词词库+分词工具

  2. 新版盘古代码+分词词库+分词工具 Pan Gu Segment is a library that can segment Chinese and English words from sentence. 盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。 作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。
  3. 所属分类:其它

    • 发布日期:2019-01-14
    • 文件大小:1048576
    • 提供者:mzqjson