您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Lucene中文分词器包

  2. 此分词器包用于搜索引擎中文分词,与Lucene搜索引擎框架搭配使用。
  3. 所属分类:Java

    • 发布日期:2009-05-13
    • 文件大小:873472
    • 提供者:Simonright
  1. lucene中文分词器(paoding解牛)

  2. lucene搜索引擎中文分词器,版本2.0.4,强大的中文分词效果在其它中文分词器当中独领风骚
  3. 所属分类:Java

    • 发布日期:2010-08-05
    • 文件大小:3145728
    • 提供者:wang_jia_jia
  1. 刨丁解羊中文分词器-主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词

  2. 刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。
  3. 所属分类:网络基础

    • 发布日期:2010-08-30
    • 文件大小:2097152
    • 提供者:henggua
  1. IKAnalyzer中文分词器文档和Jar包

  2. IKAnalyzer是优秀的Lucene中文分词器,效率高,可拓展性强。 本包内有学习手册和开发包,简单明了的介绍了IKAnalyzer的部署和使用。让您快速简历您的中文搜索引擎。
  3. 所属分类:Java

    • 发布日期:2010-08-31
    • 文件大小:2097152
    • 提供者:hh_liusujie
  1. 极易分词器1.5.3

  2. luncene全文检索 极易分词器 好用!
  3. 所属分类:Web开发

    • 发布日期:2011-05-21
    • 文件大小:892928
    • 提供者:zlfing
  1. 中文分词器Paoding(庖丁)

  2. 很好用的中文分词器,能很好的与搜索引擎框架整合,此jar兼容支持Lucene3.0以上版本。
  3. 所属分类:互联网

    • 发布日期:2011-08-03
    • 文件大小:136192
    • 提供者:Cmexico
  1. 中文分词器

  2. Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。 其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单
  3. 所属分类:Java

    • 发布日期:2011-11-02
    • 文件大小:1048576
    • 提供者:jun08139
  1. je-analysis-1.4.0.jar 搜索引擎分词器

  2. je-analysis-1.4.0.jar 搜索引擎分词器,开发搜索引擎必备的分词器。
  3. 所属分类:Java

    • 发布日期:2011-11-05
    • 文件大小:899072
    • 提供者:springpp1990
  1. 中文分词包

  2. 采用MMseg算法实现的中文分词器,特色是是使用搜狗词库
  3. 所属分类:Java

    • 发布日期:2012-12-26
    • 文件大小:2097152
    • 提供者:lee_xiong
  1. 横瓜中文分词器

  2. 横瓜中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。
  3. 所属分类:Web开发

  1. 基于中文的Shuzhen分词器1.1.4提供下载

  2. 此版本改进为:分词时采用了完全匹配方式(自命名的),也即将符合字典条目的词全部切分出来,在基于字典的分词中达到了“分无可分”的程度;分词时完全按照标准分词来进行,这样保证了在和一些高亮显示组件如highlighter一起使用时,能准确无误的将命中进行高亮显示,避免了Google高亮显示的 Bug;配置文件的存放支持相对路径,这样更灵活,更方便应用在一些虚拟机上;字典条目支持导入到内存中,也就是在原有JDBM字典系统的基础上增加内存字典系统,且能方便自定义导入多少条目到内存中,能自定义使用内存还
  3. 所属分类:专业指导

    • 发布日期:2008-10-22
    • 文件大小:833536
    • 提供者:yuanjian0211
  1. IK Analyzer 2012FF_hf1.zip 分词

  2. IK的2012系列的分词器!做搜索引擎初学者的
  3. 所属分类:Web开发

    • 发布日期:2014-09-23
    • 文件大小:2097152
    • 提供者:hu948162999
  1. Solr5.5搜索引擎之分词原理说明

  2. 介绍了Solr5.5内部使用的分词原理,有助于开发者自定义自己的分词器时掌握分词的基础知识。
  3. 所属分类:Web开发

    • 发布日期:2016-05-17
    • 文件大小:166912
    • 提供者:tongmap
  1. lucene.net +盘古分词器 实例

  2. Lucene.Net只是一个全文检索开发包,不是一个成型的搜索引擎 它提供了类似SQLServer数据库正式版中的全文检索功能的索引库 你把数据扔给Lucene.Net,【Lucene.Net只针对文本信息建立索引,所以他只接收文本信息,如果不是文本信息,则要转换为文本信息】它会将文本内容分词后保存在索引库中,当用户输入关键字提交查询时,Lucene.Net从索引库中检索关键字数据,所以搜索速度非常快,适合于用户开发自己站内的搜索引擎 Q:分词 A:即将"不是所有痞子都叫一毛"文本内容通过分词
  3. 所属分类:C#

    • 发布日期:2017-02-27
    • 文件大小:2097152
    • 提供者:zhfpoet
  1. solr分词器

  2. 搜索引擎用来搜索分词搜索,---
  3. 所属分类:其它

    • 发布日期:2018-06-23
    • 文件大小:2097152
    • 提供者:weixin_42182488
  1. solr和中文分词器.zip

  2. Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
  3. 所属分类:互联网

    • 发布日期:2020-05-06
    • 文件大小:150994944
    • 提供者:qq_44719527
  1. elasticsearch-6.2.2,ik分词器,kibana-6.2.2-windows-64

  2. Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
  3. 所属分类:搜索引擎

    • 发布日期:2020-04-29
    • 文件大小:102760448
    • 提供者:qq_43391088
  1. 搜索引擎IK分词器.zip

  2. 搜索引擎的分词器,非常好用。
  3. 所属分类:Java

    • 发布日期:2019-10-13
    • 文件大小:1048576
    • 提供者:abstruct01
  1. 搜索引擎-中文分词.zip

  2. 设计并实现一个中文分词器 分词是匹配词典的,当两个常用词典中未包含所需分隔的词语时,是不能得到正确结果的,请在任意词典中添加。
  3. 所属分类:Java

    • 发布日期:2020-06-06
    • 文件大小:548864
    • 提供者:qq_45337021
  1. 【NLP】之 结巴分词

  2. 1.结巴分词简介 结巴分词是当前效果较好的一种中文分词器,支持中文简体、中文繁体分词,同时还支持自定义词库。 结巴分词支持三种分词模式:精确模式、全模式和搜索引擎模式。 精确模式是试图将句子最精确的进行切分,适合用于文本分析; 全模式的原理是把句子中全部可以成词的词语全部扫描出来,它的分词速度快,缺点是无法识别歧义词句; 搜索引擎模式是在精确模式的基础上进一步处理的,它对较长的词语再进行分割,将召回率提高,适合于搜索引擎分词。 结巴分词自带一个词典,内含20000多条词,及词条出现的次数与词
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:159744
    • 提供者:weixin_38531017
« 12 3 4 5 »