您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. solr 企业搜索引擎教程

  2. Apache Solr 是一个开源的搜索服务器,Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一 个描述所有 Field 及其内容的 XML 文档就可以了。定制搜索的时候只需要发送 HTTP GET 请求 即可,然后对 Solr 返回的信息进行重新布局,以产生利于用户理解的页面内容布局。Solr 1.3 版 本开始支持从数据库(通过 JDBC)、 RSS 提要、 We
  3. 所属分类:项目管理

    • 发布日期:2011-10-08
    • 文件大小:720896
    • 提供者:a280606790
  1. LuceneInAction(第2版)_中文版

  2. 内容简介   《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用Tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为读者展示了一个奇妙的搜索世界。   《Lucene实战(第2版)》适合于已具有一定Java编程基本的读者
  3. 所属分类:Java

    • 发布日期:2012-07-12
    • 文件大小:48234496
    • 提供者:liujun13579
  1. 自然语言处理资料

  2. 计算语言学讲义(刘群-中国科学院计算技术研究所) 基于Lucene的在线客服机器人的研究与实现 基于OWL的旅游领域本体的构建 基于本体的受限领域问答系统研究 基于本体的受限领域问答系统知识库的构建及答案抽取 受限领域问答系统的中文问句分析研究 基于问句语义表征的中文问句相似度计算方法 基于支持向量机的汉语问句分类术 基于自然语言理解的受限领域自动应答系统 受限领域问答系统的中文问句分析研究 受限领域自然语言数据库查询接口研究 银行领域汉语自动问答系统BAQS的研究与实现 HIT-IRLab-
  3. 所属分类:其它

    • 发布日期:2012-11-30
    • 文件大小:45088768
    • 提供者:deshi168
  1. lucene的分词的测试工程

  2. lucene的分词的测试工程,包括分词器的比较,扩展停用词,同义词分词等
  3. 所属分类:Java

    • 发布日期:2013-04-21
    • 文件大小:4194304
    • 提供者:wxwzy738
  1. 向LUCENE搜索引擎中加人中文同义词查询

  2. 介绍lucene同义词库的使用,想使用lucene同义词的朋友们,如果不知道原理的可以看下。
  3. 所属分类:Java

    • 发布日期:2013-08-08
    • 文件大小:163840
    • 提供者:u010454030
  1. mmseg4j-all-1.8.5-with-dic

  2. lucene中文分词工具包,自己用ant编译成功的。可以进行定制的分词器,同义词开发。作为工具包使用。官网没有提供,组要自己编译,方便用传上来
  3. 所属分类:其它

    • 发布日期:2013-08-12
    • 文件大小:706560
    • 提供者:bingdongguke
  1. Lucene 3.6 学习笔记

  2. 目录 序言: 1 第一章 LUCENE基础 2 1.1 索引部分的核心类 2 1.2 分词部分的核心类 2 1.3 搜索部分的核心类 2 第二章 索引建立 3 2.1 创建Directory 3 2.2 创建Writer 3 2.3 创建文档并且添加索引 4 2.4 查询索引的基本信息 5 2.5 删除和更新索引 5 (1) 使用writer删除 5 (2) 使用reader删除 5 (3) 恢复删除 5 (4) 彻底删除 6 (5) 更新索引 6 (6) 手动优化 6 2.6 索引文件作用
  3. 所属分类:Java

    • 发布日期:2014-08-05
    • 文件大小:2097152
    • 提供者:yiwangxianshi
  1. jcseg-1.9.7.zip

  2. Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! PS:压缩包中含有jcseg-core-1.9.7.jar、jcseg-analyzer-1.9.7.ja
  3. 所属分类:Java

    • 发布日期:2015-12-17
    • 文件大小:823296
    • 提供者:li277967151
  1. lucene5.5做同义词分析器

  2. 根据lucene最新版本5.5做同义词分析器,熟悉内部分析构造
  3. 所属分类:Java

    • 发布日期:2016-04-01
    • 文件大小:4194304
    • 提供者:liuvlun
  1. 支持Spring-data-solr1.5的ik分词器,同义词

  2. 支持Spring-data-solr1.5的ik分词器,并且修改了代码,添加一个新的类,用于支持同义词,目前可以同时支持分词和同义词的功能。 修改 managed-schema,添加 ...展开收缩
  3. 所属分类:Java

    • 发布日期:2016-04-28
    • 文件大小:1048576
    • 提供者:wlf820
  1. IKAnalyzer2012FF_u1 完美支持粗细力度分离/扩展停用同义词/

  2. 添加ik分词器时加入以下代码即可 isMaxWordLength属性为true则使用细粒度分词 反之使用粗粒度 ...展开收缩
  3. 所属分类:Java

    • 发布日期:2017-04-06
    • 文件大小:1048576
    • 提供者:x631617479
  1. 盘古分词2.3.1.0

  2. 盘古分词可以根据词频来解决分词的歧义题目 多元分词 盘古分词提供多重输入解决分词粒度和分词精度衡量的问题 详见eaglet/archive/2008/10/02/.html 中文人名识别 输入:“张三说切实其实实在理” 分词了局:张三/说/的/确实/在理/ 输入“李三买了一张三角桌子” 分词结果:李三/买/了/一张/三角/桌子/ 详见eaglet/archive/2009/08/19/.html 强逼一元分词 输入“张三说的确实在理” 分词结果:中文。张(0,1)/张三(0,5)/三说的(1,
  3. 所属分类:C#

    • 发布日期:2017-08-18
    • 文件大小:207872
    • 提供者:xzhanjing55
  1. lucene中文分词、同义词制作源码

  2. lucene分词器demo,有lucene自带的分词器及其使用方法,也有mmseg分词及其使用、同义词的简单实现;
  3. 所属分类:Java

    • 发布日期:2018-02-14
    • 文件大小:2097152
    • 提供者:qq_33999844
  1. Elasticsearch window 压缩包

  2. ES是一个基于Lucene的分布式全文搜索服务器,和SQL Server的全文索引(Fulltext Index)有点类似,都是基于分词和分段的全文搜索引擎,具有分词,同义词,词干查询的功能,但是ES天生具有分布式和实时的属性,本随笔演示在Windows环境中安装ElasticSearch,以及用于管理ElasticSearch的Head插件
  3. 所属分类:其它

    • 发布日期:2019-01-30
    • 文件大小:113246208
    • 提供者:qq_42434115
  1. Android代码-jcseg

  2. Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene, solr, elasticsearch的分词接口!Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能
  3. 所属分类:其它

    • 发布日期:2019-08-05
    • 文件大小:1048576
    • 提供者:weixin_39840515
  1. jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最

  2. Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等!
  3. 所属分类:其它

    • 发布日期:2019-10-13
    • 文件大小:2097152
    • 提供者:weixin_38744153
  1. 快速构建PHP全文检索——马明练

  2. 信息检索,全文检索,IR基础,反向索引,同步机制,批量处理检索比较 全文检索数据库LKE 索引使用事先建好的全文索引用不到索引,只能遍历匹配 % eight%也会匹配 height 匹配效笑/通过分词器切割匹配,良好\9m%me就不能匹配颠 支持中文、英文词干 倒的ⅹx.net. XXX. COm 相关度基于概率模型的相关性算无相关算法,匹配一次或多次 法,越相关的排在越前面 无明显区别 可定制通过定制分词器,实现不同 索引规则 难以定制 结论支持大数据,性能高效果好/效率低,相关性差,模糊检索
  3. 所属分类:PHP

    • 发布日期:2019-03-04
    • 文件大小:1048576
    • 提供者:danyidanfei
  1. 基于Lucene的中文分词器的改进与实现

  2. Lucene是一个高效的全文检索工具包,本文主要研究了Lucene的体系架构及其在中文检索上的应用。通过对基于最大匹配算法的中文分词器的设计与改进,并引入文本解析器与构建同义词词库引擎,使得Lucene对中文的检索更加个性化。通过检索结果的对比表明,改进后的中文分词器对检索功能的扩展有了极大的提高。并最终构建出了一个高效的中文全文检索系统。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:550912
    • 提供者:weixin_38643212
  1. python Elasticsearch索引建立和数据的上传详解

  2. 今天我想讲一讲关于Elasticsearch的索引建立,当然提前是你已经安装部署好Elasticsearch。 ok,先来介绍一下Elaticsearch,它是一款基于lucene的实时分布式搜索和分析引擎,是后台系统,用来存储数据,检索数据,属于完全命令行交互。 那为什么选择python作为脚本进行命令的写入和数据的上传呢?那是因为Python里面有固定的模板,可以上传数据到Elasticsearch。 接下来就聊一聊该如何编写代码: 我们上传数据之后,数据到哪里去了呢?  存在索引里面了。
  3. 所属分类:其它

    • 发布日期:2020-12-31
    • 文件大小:177152
    • 提供者:weixin_38545117