您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Nutch构建主题搜索引擎的研究

  2. 基于Nutch构建主题搜索引擎的研究
  3. 所属分类:其它

    • 发布日期:2007-08-11
    • 文件大小:303104
    • 提供者:azy_bug
  1. 搜索引擎-原理、技术与系统

  2. 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索 引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类 等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的 实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等 专业的研究生或高年级本科生的教学参
  3. 所属分类:Web开发

    • 发布日期:2009-05-20
    • 文件大小:3145728
    • 提供者:moxiaolan
  1. 主题式搜索引擎中Web页面检索与推荐技术的研究

  2. 主题式搜索引擎中Web页面检索与推荐技术的研究
  3. 所属分类:Web开发

  1. 搜索引擎中主题爬虫的研究

  2. 搜索引擎中主题爬虫 来自CNKI
  3. 所属分类:其它

    • 发布日期:2007-11-05
    • 文件大小:2097152
    • 提供者:ZCH611407
  1. 搜索引擎原理.pdf

  2. 前言 随着互联网的不断发展和日益普及,网上的信息量在爆炸性增长,在2004年4月,全球Web页面的数目已经超过40亿,中国的网页数估计也超过了3亿。目前人们从网上获得信息的主要工具是浏览器,而通过浏览器得到信息通常有三种方式。第一,直接向浏览器输入一个关心的网址(URL),例如http://net.pku.edu.cn,浏览器返回所请求的网页,根据该网页内容及其包含的超链文字(anchor text)的引导,获得自己需要的内容;第二,登录到某个知名门户网站,例如http://www.yahoo
  3. 所属分类:网络基础

    • 发布日期:2010-02-22
    • 文件大小:3145728
    • 提供者:fan7hoo
  1. 基于Lucene面向主题搜索引擎的研究与设计

  2. 面向主题搜索引擎的研究与设计 面向主题搜索引擎的研究与设计 面向主题搜索引擎的研究与设计 面向主题搜索引擎的研究与设计
  3. 所属分类:其它

    • 发布日期:2010-08-08
    • 文件大小:9437184
    • 提供者:guocaihui
  1. 主题搜索引擎网络爬虫搜索策略的研究与实现

  2. 关于搜索引擎的研究,根据网络页面结构的特点,提出通过页面之间的主题传递来预测页面主题相关性的方法,解决了主题爬虫通道阻塞,抓取遗漏问题。
  3. 所属分类:网络基础

    • 发布日期:2011-03-05
    • 文件大小:4194304
    • 提供者:keyishiyu
  1. 基于Nutch的电力行业全文搜索引擎的研究与设计.pdf

  2. 目前,通用搜索引擎对行业领域及特定主题信息覆盖率较低,且无法保证检索信息数据的安全性。因此,本文在开源的Nutch 搜索引擎架构的基础, 通过构建电力行业词典,利用改进的空间向量算法对抓取内容的相关度进行计算,并对相关内容进行过滤,结合主流的PageRank算法对搜索结果综合排序,并嵌入访问控制模块,对用户的访问权限进行认证, 对获取的信息数据进行基于权限的分类, 构建出具有电力行业特色的搜索专业引擎。提高了行业信息搜索的专业性,加强了搜索引擎的安全性。
  3. 所属分类:Java

    • 发布日期:2011-06-01
    • 文件大小:762880
    • 提供者:jove1357
  1. 垂直搜索引擎的设计与实现

  2. 随着信息多元化的发展,通用搜索引擎己经不能满足主题用户的需求。用户迫切需要一个数据分类细致、精确、全面、更新及时的面向特定主题的搜索技术和方法来获得主题资源信息。在这种需求的推动下,垂直搜索引擎应运而生。 论文研究了搜索引擎的相关技术,通过分析基于查询串方式的搜索引擎和分类目录式搜索引擎的整体结构,设计了垂直搜索引擎的系统结构,并对其中涉及的关键技术:触b搜集器、信息抽取技术、中文分词和检索技术进行了深入研究,期望对推进本领域的技术发展作一点贡献。 在总体设计方面采用的是模块化思想,垂直搜索引
  3. 所属分类:其它

    • 发布日期:2011-06-28
    • 文件大小:3145728
    • 提供者:ychtxb
  1. 搜索引擎的技术与原理

  2. 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。全书分三篇共13 章内容,从基本工作原理概述开始,到一个小型简单搜索 引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术;最后面向主题和个性化的Web 信息服务,阐述了中文网页自动分类 等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的 实验数据,具有学习和实用双重意义。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等 专业的研究生或高年级本科生的教
  3. 所属分类:C++

    • 发布日期:2012-05-21
    • 文件大小:3145728
    • 提供者:hsg4ok
  1. 搜索引擎的工作原理

  2.   本书系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建方案。全书分三篇共13章内容,从基本工作原理概述,到一个小型简单搜索引擎具体细节的实现,进而详细讨论了大规模分布式搜索引擎系统的设计要点及其关键技术;最后介绍了面向主题和个性化的web信息服务,阐述了中文网页自动分类等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的实验数据,具有学习和实用双重意义。   本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的研究生或高年级本科生的教学参考书和
  3. 所属分类:Web开发

    • 发布日期:2008-07-18
    • 文件大小:3145728
    • 提供者:peng3409
  1. 基于Lucene的Web搜索引擎的研究

  2. 优秀的研究生毕业论文,主题为基于Lucene的Web搜索引擎
  3. 所属分类:网络管理

    • 发布日期:2012-10-04
    • 文件大小:2097152
    • 提供者:lwy_zhj
  1. Java搜索引擎的研究与实现(含文档+源码)

  2. Java搜索引擎的研究与实现(含文档+源码)目录 1摘要 3第一章 引言 4第二章 搜索引擎的结构 52.1系统概述 52.2搜索引擎的构成 52.2.1网络机器人 52.2.2索引与搜索 52.2.3 Web服务器 62.3搜索引擎的主要指标及分析 62.4小节 6第三章 网络机器人 73.1什么是网络机器人 73.2网络机器人的结构分析 73.2.1如何解析HTML 73.2.2 Spider程序结构 83.2.3如何构造Spider程序 93.2.4如何提高程序性能 113.2.5网络机
  3. 所属分类:Java

    • 发布日期:2008-07-31
    • 文件大小:892928
    • 提供者:rfxia
  1. Java搜索引擎的研究与实现(文档+源码)

  2. Java搜索引擎的研究与实现(含文档+源码) 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 52.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spider程序 9 3.2.4如何
  3. 所属分类:Java

    • 发布日期:2013-01-08
    • 文件大小:892928
    • 提供者:qq_zsq
  1. 垂直搜索引擎聚焦爬虫技术研究

  2. 介绍了一种垂直搜索引擎的爬虫设计方案,这是主题搜索引擎的核心部分。
  3. 所属分类:其它

    • 发布日期:2013-07-08
    • 文件大小:1048576
    • 提供者:u011337476
  1. 主题爬虫的设计与实现

  2. 文章以主题相关度为核心研究了设计主题爬虫的相关技术,通过实验给出了具体实现。 实验结果充分论证了其可行性与实用性,为进行主题搜索引擎设计和主题信息采集奠定了良好的基 础。
  3. 所属分类:专业指导

    • 发布日期:2009-03-21
    • 文件大小:151552
    • 提供者:v3liuhuan
  1. 通信与网络中的一种基于知识库的语义检索系统模型的研究

  2. 目前检索系统主要是基于关键字的全文匹配或者是按主题进行分类。但是,前者仅仅是进行字符串的匹配,不能对信息的语义进行揭示;而主题分类对信息资源揭示的效率较低、深度有限。根据对信息资源中不同对象和层次揭示上的需要,文献目录、索引、机读数据库、网络搜索引擎等信息资源检索工具构成的以不同检索需要为目标的、形式多样的、完备的系统。所谓检索系统,是指图书情报档案工作者和其他学者按某种方式方法建立起来的供读者查检图书情报档案资料等信息的某种有层次的体系,它们是客观存在的设施和设备。   根据处理网络文档方式
  3. 所属分类:其它

    • 发布日期:2020-10-22
    • 文件大小:304128
    • 提供者:weixin_38693192
  1. 主题搜索引擎的研究

  2. 介绍了将开源的全文检索工具包Lucene嵌入到自己的搜索引擎中来满足开发主题搜索引擎的需求。并基于Lucene中文分词的不足设计了一个比较完善的中文分词器,然后将其引入具体应用中,并且与传统搜索引擎在性能上进行了比较。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:114688
    • 提供者:weixin_38698174
  1. 含有丰富结构化数据的Web页面分类技术的研究

  2. Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分类方法针对含有丰富结构化数据的Web页面,提出了复用结构化数据抽取模板来进行Web页面主题识别的分类框架该框架首先解析Web页面的组织结构,通过属性探测算法,获得Web页面所包含的主题关键词进一步通过计算主题关键词与结构化抽取模板的相似性来判定Web页面的主题并按照领域进行分
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:555008
    • 提供者:weixin_38751177
  1. 一种基于知识库的语义检索系统模型的研究

  2. 目前检索系统主要是基于关键字的全文匹配或者是按主题进行分类。但是,前者仅仅是进行字符串的匹配,不能对信息的语义进行揭示;而主题分类对信息资源揭示的效率较低、深度有限。根据对信息资源中不同对象和层次揭示上的需要,文献目录、索引、机读数据库、网络搜索引擎等信息资源检索工具构成的以不同检索需要为目标的、形式多样的、完备的系统。所谓检索系统,是指图书情报档案工作者和其他学者按某种方式方法建立起来的供读者查检图书情报档案资料等信息的某种有层次的体系,它们是客观存在的设施和设备。   根据处理网络文档方式
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:348160
    • 提供者:weixin_38502693
« 12 3 4 5 6 »