您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 走进搜索引擎(中) 作者:梁斌 编著

  2. 第五章搜索引擎的索引系统   第一节知识准备   信息   索引   倒排索引、倒排表、临时倒排文件、最终倒排文件   其他概念   第二节全文检索   全文检索   第三节文档编号   编号的本质   文档编号的方法   游程编码   第四节倒排索引   经典的倒排索引   正排索引(前向索引)   倒排索引   第五节数据规模的估计   齐普夫法则   布尔检索模型下的索引规模估计★   第六节涉及存储规模的一些计算   正排表与倒排表的合并   多个临时倒排文件的归并   倒排索引分布式
  3. 所属分类:专业指导

    • 发布日期:2010-12-21
    • 文件大小:6291456
    • 提供者:qinzuobin
  1. Web Data Mining (英文)

  2. 目录回到顶部↑ 第一部分 数据挖掘基础. 第1章 概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章 关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
  3. 所属分类:专业指导

    • 发布日期:2012-05-02
    • 文件大小:8388608
    • 提供者:chen_767
  1. lucene原理分析

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点: (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。 (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。 (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。 (4)设计了独立于语言和文件格式的文本分析接口,索引器通
  3. 所属分类:其它

    • 发布日期:2013-11-29
    • 文件大小:4194304
    • 提供者:u010747123
  1. lucene搜索引擎【代码以及jar包】

  2. Lucene作为一个全文检索引擎,其具有如下突出的优点:   (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。   (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。   (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。   (4)设计了独立于语言和文件格式的文本分
  3. 所属分类:Java

    • 发布日期:2009-02-06
    • 文件大小:1048576
    • 提供者:chickenlove
  1. 倒排索引与布尔查询

  2. 对所给的Tweets数据集建立倒排索引; 实现Boolean Retrieval Model,使用TREC 2014 test topics进行测试; Boolean Retrieval Model中支持and, or ,not,查询优化可选做;
  3. 所属分类:专业指导

    • 发布日期:2019-10-07
    • 文件大小:7340032
    • 提供者:weixin_43943977
  1. 快速构建PHP全文检索——马明练

  2. 信息检索,全文检索,IR基础,反向索引,同步机制,批量处理检索比较 全文检索数据库LKE 索引使用事先建好的全文索引用不到索引,只能遍历匹配 % eight%也会匹配 height 匹配效笑/通过分词器切割匹配,良好\9m%me就不能匹配颠 支持中文、英文词干 倒的ⅹx.net. XXX. COm 相关度基于概率模型的相关性算无相关算法,匹配一次或多次 法,越相关的排在越前面 无明显区别 可定制通过定制分词器,实现不同 索引规则 难以定制 结论支持大数据,性能高效果好/效率低,相关性差,模糊检索
  3. 所属分类:PHP

    • 发布日期:2019-03-04
    • 文件大小:1048576
    • 提供者:danyidanfei
  1. MapReduce-源码

  2. 第1部分:确定城市中的星巴克数量 您有一个包含有关每个星巴克位置信息的数据集。 您将使用MapReduce为每个城市提供该城市中的星巴克数量。 输入是一个csv文件starbucks-locations.csv,输出应该是一个文件cityInformation,其中每行代表一个城市以及该城市中的星巴克数量。 第2部分:倒排索引 您将建立一个倒排索引,该索引支持基于电影流派的电影查询。 查询可以采用以下形式之一: 单一电影类型,例如:戏剧,喜剧。 布尔搜索查询,仅使用AND或OR。 例如,“戏
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:1048576
    • 提供者:weixin_42166105