搜索资源 - 中文词汇分词 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 中文词汇分词

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

Lucene中文分词器包
来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。1. 正向全切分算法，42万汉字字符/每秒的处理能力（IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP）2. 对数量词、地名、路名的优化处理3. 对未知词汇采用自识别结合二元切分算法，确保搜索召回率（使用方法请参考IKAnalyzer V1.1版）
所属分类：其它
- 发布日期：2007-08-14
- 文件大小：873472
- 提供者：linliangyi2006

IKAnalyzer 3.0 中文分词器
1.IKAnalyzer3.0介绍 IKAnalyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始，IKAnalyzer 已经推出了3个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0 则发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。 1.2IKAnalyzer3.0特性 * 采用了特有的“正向迭代最细粒度切分
所属分类：其它
- 发布日期：2009-07-21
- 文件大小：1048576
- 提供者：linliangyi2006

引入局部统计识别高频词汇的Lucene中文分词程序src.rar
引入局部统计识别高频词汇的Lucene中文分词程序src.rar
所属分类：专业指导
- 发布日期：2009-07-29
- 文件大小：32768
- 提供者：luanmad

引入局部统计识别高频词汇的Lucene中文分词程序STUSegmentConfig.rar
引入局部统计识别高频词汇的Lucene中文分词程序STUSegmentConfig.rar
所属分类：专业指导
- 发布日期：2009-07-29
- 文件大小：754
- 提供者：luanmad

csw5.0中文分词组件
一、CSW中分词组件简介 CSW中文分词组件，是一套可自动将一段文本按常规汉语词组进行拆分，并以指定方式进行分隔的COM组件。本组件采用独有的高效的分词引擎及拆分算法，具有准确、高速、资源占用率小等特点。为了满足客户对文本语义进行研究分析的需要，本组件同时提供词性及词频标注功能，可根据用户要求，对其拆分后的词组进行词性标注或词频标注。互联网信息检索、数据库信息查询、智能聊天机器人、文本校对、自动翻译、自动摘要、自动分类及信息加工处理等各个领域。二、本组件特点： 1．适应性强本组全部件采用
所属分类：C#
- 发布日期：2009-09-01
- 文件大小：3145728
- 提供者：madl_lxj_163

lucene分词测试代码
用java写的图形分词测试的小东西,用的分词器是:来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器，其使用“正向全切分算法”，42万汉字字符/每秒的处理能力（IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP），对数量词、地名、路名的优化处理，对未知词汇采用自识别结合二元切分算法，确保搜索召回率。但是没有源代码下载，只能联系作者索要。
所属分类：其它
- 发布日期：2007-11-21
- 文件大小：2097152
- 提供者：robinfoxnan

ACWPS（爱博汉语分词系统）分词组件 asp分词组件
爱博汉语分词系统Web服务器支持标准的HTTP协议，可以跨平台调用，支持分布式运算；爱博汉语分词系统COM组件提供COM和DLL接口（Windows环境）以及共享库.so（Linux）形式，可支持所有支持COM接口调用的编程语言及脚本语言。如：PHP、JSP、ASP、ASP.net、C/C++ 、VC6.0 、VC.net、BC、C#、VB6.0 、VB.net、Delphi、Java等。爱博汉语分词系统支持自定义词语的功能，用户可根据自己需要定义添加汉语词组。可根据需要自行定义影响
所属分类：C#
- 发布日期：2010-02-28
- 文件大小：2097152
- 提供者：selectersky

近40万词汇的中文分词词库
access的分词词库，从网络搜集的近40万词汇，num字段代表关键词的热度
所属分类：网络基础
- 发布日期：2010-06-19
- 文件大小：5242880
- 提供者：asyncyd

IKAnalyzer中文分词器
基于IKAnalyzer分词算法的准商业化Lucene中文分词器。1. 正向全切分算法2. 对数量词、地名、路名的优化处理3. 对未知词汇采用自识别结合二元切分算法，确保搜索召回率（使用方法请参考IKAnalyzer V1.1版）
所属分类：其它
- 发布日期：2008-04-12
- 文件大小：873472
- 提供者：silyt

IKAnalyzer中文分词器V3.2.X使用手册
采用了特有的“正向迭代最细粒度切分算法“，具有60万字/秒的高速处理能力。采用了多子处理器分析模式，支持：英文字母（IP地址、Email、URL）、数字（日期，常用中文数量词，罗马数字，科学计数法），中文词汇（姓名、地名处理）等分词处理。优化的词典存储，更小的内存占用。支持用户词典扩展定义针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐)；采用歧义分析算法优化查询关键字的搜索排列组合，能极大的提高Lucene检索的命中率。
所属分类：Java
- 发布日期：2011-08-03
- 文件大小：500736
- 提供者：feiyu84

简单的中文分词系统
简单的中文分词，要求安装了JDK，点击运行即可，词汇在TXT中，可以随意更改，希望大家一起学习
所属分类：Java
- 发布日期：2011-12-04
- 文件大小：595968
- 提供者：baby0118

IKAnalyzer中文分词器V2012使用手册
采用了特有的“正向迭代最细粒度切分算法“，具有60万字/秒的高速处理能力。采用了多子处理器分析模式，支持：英文字母（IP地址、Email、URL）、数字（日期，常用中文数量词，罗马数字，科学计数法），中文词汇（姓名、地名处理）等分词处理。优化的词典存储，更小的内存占用。支持用户词典扩展定义针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐)；采用歧义分析算法优化查询关键字的搜索排列组合，能极大的提高Lucene检索的命中率。
所属分类：Java
- 发布日期：2012-03-13
- 文件大小：847872
- 提供者：mailjava

简易中文分词服务器
中英文混合分词服务器3.0正式发布，绝对稳定高效，分词库扩大到了190多万词汇，算法做了全面修正，稳定性、健壮性、速度都有了质的飞跃！同时提供c、java、C#、delphi、js调用范例支持大规模并发，线程安全、5万字以内的文章但线程切分1秒内可以切分完毕！
所属分类：其它
- 发布日期：2012-03-17
- 文件大小：6291456
- 提供者：max09601

Lucene的中文分词方法设计与实现
本文设计实现了一个中文分词模块，其主要研究目的在于寻找更为有效的中文词汇处理方法，提高全文检索系统的中文处理能力．整个模块基于当前最流行的搜索引擎架构 Lucene，实现了带有歧义消除功能的正向最大匹配算法．在系统评测方面，比较了该方法与现有方法的区别，对于如何构建一个高效的中文检索系统，提出了一种实现．关键词：中文分词；搜索引擎；Lucene；正向最大匹配
所属分类：Java
- 发布日期：2012-09-14
- 文件大小：356352
- 提供者：david__zhang

基于Lucene的中文分词方法设计与实现
本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力. 整个模块基于当前最流行的搜索引擎架构 Lucene ,实现了带有歧义消除功能的正向最大匹配算法. 在系统评测方面,比较了该方法与现有方法的区别,对于如何构建一个高效的中文检索系统,提出了一种实现
所属分类：其它
- 发布日期：2012-12-26
- 文件大小：328704
- 提供者：zyddamon

IKAnalyzer2013.zip
IKAnalyzer是一个开源的，基于java 语言开发的轻量级的中文分词工具包。该包是根据IKAnalyzer2012修改而成，可以支持版本lucene4.3.0 打包文件包含jar包，source源码文件以及IKAnalyzer中文分词器V2012使用手册
所属分类：Java
- 发布日期：2013-05-22
- 文件大小：6291456
- 提供者：somewindy

中文分词服务器3.3
软件名称：百万商业圈简易中文分词服务器作者:百万商业圈版本:3.2(目前最新单线程服务器版,支持并发) 具体使用时可将 bwsyq.com.dat 放在分词服务器相同的目录即可使用前请先启动分词服务器分词服务器程序既是一个windows 服务程序, 服务名称是：bwsyq fenci service and serve 0.1 (百万商业圈中文分词服务器) 同时又是一个简单的webserver安装启动后，你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用同时
所属分类：其它
- 发布日期：2013-09-02
- 文件大小：6291456
- 提供者：yefengying

pscws23-20081221.tar.bz2【中文分词】
php中文分词 ===== PSCWS23 - 说明文档 ===== $Id: readme.txt,v 1.3 2008/12/21 04:37:59 hightman Exp $ [ 关于 PSCWS23 ] PSCWS23 是由 hightman 于 2006 年开发的纯 PHP 代码实现的简易中文分词系统第二和第三版的简称。 PSCWS 是英文 PHP Simple Chinese Words Segmentation 的头字母缩写，它是 SCWS 项目的前身。现 SCWS 已作为
所属分类：PHP
- 发布日期：2013-09-08
- 文件大小：2097152
- 提供者：yao__shun__yu

ICA中文分词软件
采用了多子处理器分析模式，支持：英文字母（IP地址、Email、URL）、数字（日期，常用中文数量词，罗马数字，科学计数法），中文词汇（姓名、地名处理）等分词处理。
所属分类：其它
- 发布日期：2014-11-16
- 文件大小：6291456
- 提供者：u010608070

IK Analyzer 开源中文分词 2012 u6.zip
IK Analyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始， IKAnalyzer已经推出了4个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。从3.0版本开始，IK发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。在2012版本中，IK实现了简单的分词歧义排除算法，标志着IK分词器从单纯的词典分词向模拟语义分词衍化。 IK Analyz
所属分类：其它
- 发布日期：2019-07-06
- 文件大小：2097152
- 提供者：weixin_39840650

« 12 3 4 »