您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 自己动手写搜索引擎(罗刚著).doc

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:其它

    • 发布日期:2011-04-18
    • 文件大小:6291456
    • 提供者:qq736655941
  1. 《自己动手写搜索引擎》罗刚——doc版

  2.  《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。   自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。   其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。   在实现搜索方面,《自己动手写搜索引擎》用
  3. 所属分类:Web开发

  1. 自己动手写搜索引擎(罗刚)

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:Java

    • 发布日期:2012-04-25
    • 文件大小:3145728
    • 提供者:jayghost
  1. solr搭建(含拼音检索,三种分词器,停词器,扩展词库)

  2. solr的基本搭建,拼音检索,三种分词器(smartcn ,IK,mmseg4j)的安装,停词器的安装
  3. 所属分类:Java

    • 发布日期:2014-01-16
    • 文件大小:7340032
    • 提供者:ziyu08161820
  1. pinyinAnalyzer4.3

  2. pinyinAnalyzer4.3.1.jar 拼音分词 solr suggest
  3. 所属分类:Java

    • 发布日期:2014-06-26
    • 文件大小:10240
    • 提供者:address123
  1. 中文拼音分词器

  2. 针对中文进行修改的拼音分词器,很强大,支持首字母搜索、全拼搜索,首字母+全拼搜索!配置如下: ...展开收缩
  3. 所属分类:Java

    • 发布日期:2015-11-19
    • 文件大小:21504
    • 提供者:lies_joker
  1. jcseg-1.9.7.zip

  2. Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! PS:压缩包中含有jcseg-core-1.9.7.jar、jcseg-analyzer-1.9.7.ja
  3. 所属分类:Java

    • 发布日期:2015-12-17
    • 文件大小:823296
    • 提供者:li277967151
  1. pinyinAnalyzer

  2. 拼音分词,solr 测试通过可用
  3. 所属分类:Java

    • 发布日期:2016-03-15
    • 文件大小:10240
    • 提供者:uustile
  1. pinyin4j-2.5.0.jar及pinyinAnalyzer4.3.1.jar

  2. pinyin4j-2.5.0.jar及pinyinAnalyzer4.3.1.jar,solr5.3做拼音分词所需jar包。
  3. 所属分类:Java

    • 发布日期:2016-11-21
    • 文件大小:207872
    • 提供者:znsqingfeng
  1. solr cloud6.1.0拼音分词

  2. solr cloud6.x.x 都可以用,solr的拼音分词
  3. 所属分类:Java

    • 发布日期:2017-02-16
    • 文件大小:204800
    • 提供者:yangcl123
  1. word-1.3.1.jar中文分词

  2. word 分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。
  3. 所属分类:Hadoop

    • 发布日期:2017-09-26
    • 文件大小:25165824
    • 提供者:shuaigexiaobo
  1. pinyinAnalyzer4.3.1.jar(solr拼音分词jar包)

  2. pinyinAnalyzer4.3.1.jar,solr做拼音分词所需jar包。 加入两个jar包:pinyin4j-2.5.0.jar、pinyinAnalyzer.jar后再配置schema.xml文件即可使用
  3. 所属分类:Java

    • 发布日期:2017-10-11
    • 文件大小:10398
    • 提供者:xiazaiva
  1. elasticsearch-analysis-ik-5.6.1和elasticsearch-analysis-pinyin-5.6.1

  2. elasticsearch或solr索引在安装的时候需要添加的分词器和拼音插件,该版本是5.6.1,分别为:elasticsearch-analysis-ik-5.6.1和elasticsearch-analysis-pinyin-5.6.1,都是已经编译好了的,可直接复制到plugin里面即可,对应的es的版本号也必须是5.6.1
  3. 所属分类:Java

    • 发布日期:2017-12-02
    • 文件大小:11534336
    • 提供者:alan_liuyue
  1. solr7.x ikanalyzer pinyin 分词

  2. solr7.x ikanalyzer pinyin 分词。亲测solr7.3.1可用。
  3. 所属分类:其它

    • 发布日期:2018-07-17
    • 文件大小:1048576
    • 提供者:lvzhyt
  1. Android代码-jcseg

  2. Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene, solr, elasticsearch的分词接口!Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能
  3. 所属分类:其它

    • 发布日期:2019-08-05
    • 文件大小:1048576
    • 提供者:weixin_39840515
  1. jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最

  2. Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!
  3. 所属分类:其它

    • 发布日期:2019-10-13
    • 文件大小:2097152
    • 提供者:weixin_38744153
  1. ik拼音分词jar高低版本打包奉上

  2. 高低版本都打包在里面了,可先使用低版本,兼容6.x及以上solr,高版本分词器看哪位客官需要了
  3. 所属分类:其它

    • 发布日期:2019-01-11
    • 文件大小:248832
    • 提供者:yiqiefucong
  1. pinyin-plus:简繁体汉字转拼音的项目,解决多音字的问题。ElasticSearch,solr的拼音分词工具-源码

  2. 拼音加 汉字转拼音的库,有如下特点 拼音数据基于 , 开放词库 基于拼音词库的数据初始化分词引擎进行分词,正确度高,解决多音字的问题 支持繁体字 支持自定义词库,词库格式同cc-cedict字典格式 api简单,分为普通模式,索引模式 使用场景 汉字转拼音,常用于索引引擎场景创建拼音的索引,这个场景的问题一般由两种实现路径,一种是直接使用带拼音的分词插件,会自动帮你创建出拼音的索引,还有一种就是自己将汉字转换为拼音字符串,采用间隔分隔分词来达到自定义化索引的目的。恰恰是实现路径,都离不开分词和拼
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:3145728
    • 提供者:weixin_42128988
  1. jcseg:Jcseg是用Java开发的轻量级NLP框架。 提供基于MMSEG算法的CJK和英语细分,并基于TEXTRANK算法实现关键词提取,关键句提取,摘要提取。 Jcseg具有内置的http服务器和用于最新lucene,solr,el

  2. Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键在于提取,关键句提取和文章自动摘要等功能,并提供了一个基于Jetty的web服务器,方便各大语言直接Jcseg自带了一个jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加名词等! Jcseg核心功能: 中文分词:mmseg算法+ Jcseg独创的优化算法,七种切分模式。 关键字提取:基于textRank算
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:4194304
    • 提供者:weixin_42123296