开发工具:
文件大小: 13mb
下载次数: 0
上传时间: 2010-08-19
详细说明:中英文分词组件。完全C#托管代码编写,独立开发。
技术特点
=========
1. 识别率接近90%。
虽然和专业分词系统相比有一定的差距,但对于搜索引擎等小型分词需求而言足够了。
2. 多元歧义自动识别。
对于前后歧义有较好的识别效果。
如:
长春市长春节致词 -- 长春/市长/春节/致词/
长春市长春药店 -- 长春市/长春/药店
3. 常用及敏感词过滤功能。
通过一个简单的属性设置就可以完成针对常用词、标点和敏感词汇的过滤。系统内置了常用无意字词和标点的过滤。当然针对文章等分词时可以屏蔽过滤功能。
4. 控制符过滤功能。
可以设置属性值,在分词结果中保留回车换行等控制字符,从而保留原来的显示结构。
5. 内置10万多条基本词库。
系统内置包含10万多条优选词汇的基本词库,并提供编程接口任意扩充。
6. 全角字符识别能力。
如:IBM和HP都是世界级的PC制造商。-- IBM/和/HP/都/是/世界级/的/PC/制造商/。
7. 轻量级的分词组件,仅1个DLL文件,无需安装注册,发布简便。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.