点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - solr拼音分词
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
自己动手写搜索引擎(罗刚著).doc
自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
所属分类:
其它
发布日期:2011-04-18
文件大小:6291456
提供者:
qq736655941
《自己动手写搜索引擎》罗刚——doc版
《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。 自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。 其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。 在实现搜索方面,《自己动手写搜索引擎》用
所属分类:
Web开发
发布日期:2011-12-29
文件大小:6291456
提供者:
givemeoneaccount
自己动手写搜索引擎(罗刚)
自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
所属分类:
Java
发布日期:2012-04-25
文件大小:3145728
提供者:
jayghost
solr搭建(含拼音检索,三种分词器,停词器,扩展词库)
solr的基本搭建,拼音检索,三种分词器(smartcn ,IK,mmseg4j)的安装,停词器的安装
所属分类:
Java
发布日期:2014-01-16
文件大小:7340032
提供者:
ziyu08161820
pinyinAnalyzer4.3
pinyinAnalyzer4.3.1.jar 拼音分词 solr suggest
所属分类:
Java
发布日期:2014-06-26
文件大小:10240
提供者:
address123
中文拼音分词器
针对中文进行修改的拼音分词器,很强大,支持首字母搜索、全拼搜索,首字母+全拼搜索!配置如下: ...展开收缩
所属分类:
Java
发布日期:2015-11-19
文件大小:21504
提供者:
lies_joker
jcseg-1.9.7.zip
Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! PS:压缩包中含有jcseg-core-1.9.7.jar、jcseg-analyzer-1.9.7.ja
所属分类:
Java
发布日期:2015-12-17
文件大小:823296
提供者:
li277967151
pinyinAnalyzer
拼音分词,solr 测试通过可用
所属分类:
Java
发布日期:2016-03-15
文件大小:10240
提供者:
uustile
pinyin4j-2.5.0.jar及pinyinAnalyzer4.3.1.jar
pinyin4j-2.5.0.jar及pinyinAnalyzer4.3.1.jar,solr5.3做拼音分词所需jar包。
所属分类:
Java
发布日期:2016-11-21
文件大小:207872
提供者:
znsqingfeng
solr cloud6.1.0拼音分词
solr cloud6.x.x 都可以用,solr的拼音分词
所属分类:
Java
发布日期:2017-02-16
文件大小:204800
提供者:
yangcl123
word-1.3.1.jar中文分词
word 分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。
所属分类:
Hadoop
发布日期:2017-09-26
文件大小:25165824
提供者:
shuaigexiaobo
pinyinAnalyzer4.3.1.jar(solr拼音分词jar包)
pinyinAnalyzer4.3.1.jar,solr做拼音分词所需jar包。 加入两个jar包:pinyin4j-2.5.0.jar、pinyinAnalyzer.jar后再配置schema.xml文件即可使用
所属分类:
Java
发布日期:2017-10-11
文件大小:10398
提供者:
xiazaiva
elasticsearch-analysis-ik-5.6.1和elasticsearch-analysis-pinyin-5.6.1
elasticsearch或solr索引在安装的时候需要添加的分词器和拼音插件,该版本是5.6.1,分别为:elasticsearch-analysis-ik-5.6.1和elasticsearch-analysis-pinyin-5.6.1,都是已经编译好了的,可直接复制到plugin里面即可,对应的es的版本号也必须是5.6.1
所属分类:
Java
发布日期:2017-12-02
文件大小:11534336
提供者:
alan_liuyue
solr7.x ikanalyzer pinyin 分词
solr7.x ikanalyzer pinyin 分词。亲测solr7.3.1可用。
所属分类:
其它
发布日期:2018-07-17
文件大小:1048576
提供者:
lvzhyt
Android代码-jcseg
Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene, solr, elasticsearch的分词接口!Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能
所属分类:
其它
发布日期:2019-08-05
文件大小:1048576
提供者:
weixin_39840515
jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最
Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!
所属分类:
其它
发布日期:2019-10-13
文件大小:2097152
提供者:
weixin_38744153
ik拼音分词jar高低版本打包奉上
高低版本都打包在里面了,可先使用低版本,兼容6.x及以上solr,高版本分词器看哪位客官需要了
所属分类:
其它
发布日期:2019-01-11
文件大小:248832
提供者:
yiqiefucong
pinyin-plus:简繁体汉字转拼音的项目,解决多音字的问题。ElasticSearch,solr的拼音分词工具-源码
拼音加 汉字转拼音的库,有如下特点 拼音数据基于 , 开放词库 基于拼音词库的数据初始化分词引擎进行分词,正确度高,解决多音字的问题 支持繁体字 支持自定义词库,词库格式同cc-cedict字典格式 api简单,分为普通模式,索引模式 使用场景 汉字转拼音,常用于索引引擎场景创建拼音的索引,这个场景的问题一般由两种实现路径,一种是直接使用带拼音的分词插件,会自动帮你创建出拼音的索引,还有一种就是自己将汉字转换为拼音字符串,采用间隔分隔分词来达到自定义化索引的目的。恰恰是实现路径,都离不开分词和拼
所属分类:
其它
发布日期:2021-03-03
文件大小:3145728
提供者:
weixin_42128988
jcseg:Jcseg是用Java开发的轻量级NLP框架。 提供基于MMSEG算法的CJK和英语细分,并基于TEXTRANK算法实现关键词提取,关键句提取,摘要提取。 Jcseg具有内置的http服务器和用于最新lucene,solr,el
Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键在于提取,关键句提取和文章自动摘要等功能,并提供了一个基于Jetty的web服务器,方便各大语言直接Jcseg自带了一个jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加名词等! Jcseg核心功能: 中文分词:mmseg算法+ Jcseg独创的优化算法,七种切分模式。 关键字提取:基于textRank算
所属分类:
其它
发布日期:2021-02-03
文件大小:4194304
提供者:
weixin_42123296