点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 搜索引擎分词器
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
Lucene中文分词器包
此分词器包用于搜索引擎中文分词,与Lucene搜索引擎框架搭配使用。
所属分类:
Java
发布日期:2009-05-13
文件大小:873472
提供者:
Simonright
lucene中文分词器(paoding解牛)
lucene搜索引擎中文分词器,版本2.0.4,强大的中文分词效果在其它中文分词器当中独领风骚
所属分类:
Java
发布日期:2010-08-05
文件大小:3145728
提供者:
wang_jia_jia
刨丁解羊中文分词器-主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词
刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。
所属分类:
网络基础
发布日期:2010-08-30
文件大小:2097152
提供者:
henggua
IKAnalyzer中文分词器文档和Jar包
IKAnalyzer是优秀的Lucene中文分词器,效率高,可拓展性强。 本包内有学习手册和开发包,简单明了的介绍了IKAnalyzer的部署和使用。让您快速简历您的中文搜索引擎。
所属分类:
Java
发布日期:2010-08-31
文件大小:2097152
提供者:
hh_liusujie
极易分词器1.5.3
luncene全文检索 极易分词器 好用!
所属分类:
Web开发
发布日期:2011-05-21
文件大小:892928
提供者:
zlfing
中文分词器Paoding(庖丁)
很好用的中文分词器,能很好的与搜索引擎框架整合,此jar兼容支持Lucene3.0以上版本。
所属分类:
互联网
发布日期:2011-08-03
文件大小:136192
提供者:
Cmexico
中文分词器
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单
所属分类:
Java
发布日期:2011-11-02
文件大小:1048576
提供者:
jun08139
je-analysis-1.4.0.jar 搜索引擎分词器
je-analysis-1.4.0.jar 搜索引擎分词器,开发搜索引擎必备的分词器。
所属分类:
Java
发布日期:2011-11-05
文件大小:899072
提供者:
springpp1990
中文分词包
采用MMseg算法实现的中文分词器,特色是是使用搜狗词库
所属分类:
Java
发布日期:2012-12-26
文件大小:2097152
提供者:
lee_xiong
横瓜中文分词器
横瓜中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。
所属分类:
Web开发
发布日期:2013-02-26
文件大小:660480
提供者:
xiaocaixuexinwen
基于中文的Shuzhen分词器1.1.4提供下载
此版本改进为:分词时采用了完全匹配方式(自命名的),也即将符合字典条目的词全部切分出来,在基于字典的分词中达到了“分无可分”的程度;分词时完全按照标准分词来进行,这样保证了在和一些高亮显示组件如highlighter一起使用时,能准确无误的将命中进行高亮显示,避免了Google高亮显示的 Bug;配置文件的存放支持相对路径,这样更灵活,更方便应用在一些虚拟机上;字典条目支持导入到内存中,也就是在原有JDBM字典系统的基础上增加内存字典系统,且能方便自定义导入多少条目到内存中,能自定义使用内存还
所属分类:
专业指导
发布日期:2008-10-22
文件大小:833536
提供者:
yuanjian0211
IK Analyzer 2012FF_hf1.zip 分词
IK的2012系列的分词器!做搜索引擎初学者的
所属分类:
Web开发
发布日期:2014-09-23
文件大小:2097152
提供者:
hu948162999
Solr5.5搜索引擎之分词原理说明
介绍了Solr5.5内部使用的分词原理,有助于开发者自定义自己的分词器时掌握分词的基础知识。
所属分类:
Web开发
发布日期:2016-05-17
文件大小:166912
提供者:
tongmap
lucene.net +盘古分词器 实例
Lucene.Net只是一个全文检索开发包,不是一个成型的搜索引擎 它提供了类似SQLServer数据库正式版中的全文检索功能的索引库 你把数据扔给Lucene.Net,【Lucene.Net只针对文本信息建立索引,所以他只接收文本信息,如果不是文本信息,则要转换为文本信息】它会将文本内容分词后保存在索引库中,当用户输入关键字提交查询时,Lucene.Net从索引库中检索关键字数据,所以搜索速度非常快,适合于用户开发自己站内的搜索引擎 Q:分词 A:即将"不是所有痞子都叫一毛"文本内容通过分词
所属分类:
C#
发布日期:2017-02-27
文件大小:2097152
提供者:
zhfpoet
solr分词器
搜索引擎用来搜索分词搜索,---
所属分类:
其它
发布日期:2018-06-23
文件大小:2097152
提供者:
weixin_42182488
solr和中文分词器.zip
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
所属分类:
互联网
发布日期:2020-05-06
文件大小:150994944
提供者:
qq_44719527
elasticsearch-6.2.2,ik分词器,kibana-6.2.2-windows-64
Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
所属分类:
搜索引擎
发布日期:2020-04-29
文件大小:102760448
提供者:
qq_43391088
搜索引擎IK分词器.zip
搜索引擎的分词器,非常好用。
所属分类:
Java
发布日期:2019-10-13
文件大小:1048576
提供者:
abstruct01
搜索引擎-中文分词.zip
设计并实现一个中文分词器 分词是匹配词典的,当两个常用词典中未包含所需分隔的词语时,是不能得到正确结果的,请在任意词典中添加。
所属分类:
Java
发布日期:2020-06-06
文件大小:548864
提供者:
qq_45337021
【NLP】之 结巴分词
1.结巴分词简介 结巴分词是当前效果较好的一种中文分词器,支持中文简体、中文繁体分词,同时还支持自定义词库。 结巴分词支持三种分词模式:精确模式、全模式和搜索引擎模式。 精确模式是试图将句子最精确的进行切分,适合用于文本分析; 全模式的原理是把句子中全部可以成词的词语全部扫描出来,它的分词速度快,缺点是无法识别歧义词句; 搜索引擎模式是在精确模式的基础上进一步处理的,它对较长的词语再进行分割,将召回率提高,适合于搜索引擎分词。 结巴分词自带一个词典,内含20000多条词,及词条出现的次数与词
所属分类:
其它
发布日期:2021-01-20
文件大小:159744
提供者:
weixin_38531017
«
1
2
3
4
5
»