您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 海量web搜索引擎系统中用户行为的分布特征及其启示

  2. 统计了大规模搜索引擎用户行为的分布模式特征
  3. 所属分类:Web开发

    • 发布日期:2009-07-08
    • 文件大小:573440
    • 提供者:rockychan1206
  1. 海量Web信息搜集系统优化设计_谢正茂_北京大学硕士论文

  2. 论 文 摘 要 本文首先由WWW的起源和发展导出搜索引擎技术的出现和发展。北大天网是这类技术在中国的最早的成功产品之一,本文将大体介绍其体系结构和技术特点。 搜集端(crawler)是天网的主要模块之一,它的搜索速度、获取网页质量是评价搜索引擎好坏的主要指标,是检索端的工作的基石。如何更快,更好的抓取网页是本人毕业设计的工作目标。在介绍完搜集端现有的体系结构之后,本文从搜索导向、相似网页、相关度权值给定三个方面阐述它的优化策略,作为本文的重点。 最后,本文试图指出现有系统的处理能力极限和瓶颈,
  3. 所属分类:Web开发

    • 发布日期:2009-07-08
    • 文件大小:228352
    • 提供者:rockychan1206
  1. 搜索引擎的日志分析:方法、技术和应用_单松巍_北京大学硕士论文

  2. 搜索引擎技术的出现帮助为web用户在浩如烟海的WWW上快速发现、定位信息带来了福音,目前搜索引擎已经是WWW上除Email之外使用最多的服务。目前搜索引擎面临的主要困难是检索质量不高,用户满意度不高。 本文试图通过分析“天网”搜索引擎的日志来得到用户访问“天网”系统的一般性规律,并从分析结果出发改造搜索引擎。为此,我们安排了两组实验,一组实验是试探性的,我们统计了用户访问“天网”系统的查询、翻页、点击行为,希望从中得到一些规律;另一组实验是针对性的,我们针对cache系统设计了一组实验,希望能
  3. 所属分类:网络基础

    • 发布日期:2009-07-08
    • 文件大小:2097152
    • 提供者:rockychan1206
  1. 基于Lucene的Web站内信息搜索系统

  2. 随着 网 络 信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的 网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。 搜索引擎技术解决了用户检索网络信息的困难,目前Web搜索引擎(Search Engine) 技术正成为计算机科学界和信息产业界争相研究、开发的对象。
  3. 所属分类:Web开发

    • 发布日期:2009-09-03
    • 文件大小:8388608
    • 提供者:lsyaxue
  1. 搜索引擎原理.pdf

  2. 前言 随着互联网的不断发展和日益普及,网上的信息量在爆炸性增长,在2004年4月,全球Web页面的数目已经超过40亿,中国的网页数估计也超过了3亿。目前人们从网上获得信息的主要工具是浏览器,而通过浏览器得到信息通常有三种方式。第一,直接向浏览器输入一个关心的网址(URL),例如http://net.pku.edu.cn,浏览器返回所请求的网页,根据该网页内容及其包含的超链文字(anchor text)的引导,获得自己需要的内容;第二,登录到某个知名门户网站,例如http://www.yahoo
  3. 所属分类:网络基础

    • 发布日期:2010-02-22
    • 文件大小:3145728
    • 提供者:fan7hoo
  1. 垂直搜索与Web实体提取和关系分析

  2. 垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。 垂直搜索的技术   垂直搜索引擎大体上需要以下技术
  3. 所属分类:Web开发

    • 发布日期:2010-03-07
    • 文件大小:522240
    • 提供者:queenie_sun
  1. 淘特站内搜索引擎(C#版)

  2. +系统介绍+ 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。 +安装说明+ 本系统使用asp.net+C#开发,系统运行于.net framework2.0以上版本环境中。通过将文件上传到服务器,并开通系统中tot目录e
  3. 所属分类:C#

    • 发布日期:2010-04-26
    • 文件大小:371712
    • 提供者:cctcc
  1. SOPI垂直搜索引擎系统 V2.2

  2. SOPI垂直搜索引擎2.0是一个从信息采集到分析到索引的整套解决方案,让你也可以轻松拥有一个多功能垂直搜索引擎。可以针用于行业垂直信息进行搜索,网站搜索等各类应用。 SOPI垂直搜索引擎系统的应用特点 外网搜索引擎:众多内容型网站为了保持数据的最新,不得不花费大量的人力进行内容更新。 SOPI 系统可以锁定需要的网站,进行定时采集此网站的最新内容;可以节省大量的人力成本,而且可以保证信息的全面性,同时结合搜索技术在海量的信息库中快速找到需要的信息。 高应用扩展性,可以根据用户需求快速配置成为不
  3. 所属分类:Web开发

    • 发布日期:2010-05-09
    • 文件大小:2097152
    • 提供者:ntsanxin
  1. 自己动手写搜索引擎(罗刚著).doc

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:其它

    • 发布日期:2011-04-18
    • 文件大小:6291456
    • 提供者:qq736655941
  1. 彗星小助手,编程人员的好伴侣

  2. 窗口SPY,探测、操作外部窗口 基于 Win32 的实用工具,它提供系统的进程、线程、窗口和窗口消息的图形视图。使用窗口SPY可以执行下列操作: 显示系统对象(包括进程、线程和窗口)之间关系的图形树。 搜索指定的窗口、线程、进程或消息... 网页SPY,探测资源、解除限制网页 在线分析和修改器,它可以分析Microsoft Internet Explorer或是嵌套在应用程序中的浏览器窗口中正在浏览的网页内容,在保持连线状态下实时地修改它。通过使用网页SPY,你可以针对网页内每一个元素做修改,
  3. 所属分类:其它

    • 发布日期:2011-07-24
    • 文件大小:1048576
    • 提供者:ymghg
  1. 彗星小助手

  2. 窗口SPY,探测、操作外部窗口 基于 Win32 的实用工具,它提供系统的进程、线程、窗口和窗口消息的图形视图。使用窗口SPY可以执行下列操作: 显示系统对象(包括进程、线程和窗口)之间关系的图形树。 搜索指定的窗口、线程、进程或消息... 网页SPY,探测资源、解除限制网页 在线分析和修改器,它可以分析Microsoft Internet Explorer或是嵌套在应用程序中的浏览器窗口中正在浏览的网页内容,在保持连线状态下实时地修改它。通过使用网页SPY,你可以针对网页内每一个元素做修改,
  3. 所属分类:其它

    • 发布日期:2011-10-05
    • 文件大小:1048576
    • 提供者:pglsgh
  1. 彗星小助手

  2. 您是一个程序员?那彗星小助手肯定对您有用,它是一款程序开发、制作软件必备工具,用来分析窗口SPY,探测、操作外部窗口的一个小东东。 彗星小助手是基于Win32的实用工具,它提供系统的进程、线程、窗口和窗口消息的图形视图。使用窗口SPY可以执行下列操作: 显示系统对象(包括进程、线程和窗口)之间关系的图形树。 搜索指定的窗口、线程、进程或消息…网页SPY,探测资源、解除限制网页 在线分析和修改器,它可以分析Microsoft Internet Explorer或是嵌套在应用程序中的浏览器窗口中正
  3. 所属分类:网络监控

    • 发布日期:2011-11-15
    • 文件大小:1048576
    • 提供者:zhongguoren666
  1. 一种基于关键词的近似网页检测算法

  2. 针对海量Web文本信息,利用从网页主题内容提取出来的特征关键词,在倒排索引基础上建立相似度计算模型。对一篇新入库的网页文档,利用所包含的关键词迅速缩小计算范围,提高计算效率。实验结果表明该算法是有效的,小规模评测结果得到较好的效果。
  3. 所属分类:其它

    • 发布日期:2008-06-22
    • 文件大小:169984
    • 提供者:wowrur
  1. 自己动手写搜索引擎(罗刚)

  2. 自己动手写搜索引擎 1 第1章 了解搜索引擎 1 1.1 Google神话 1 1.2 体验搜索引擎 1 1.3 你也可以做搜索引擎 4 1.4 本章小结 4 第2章 遍历搜索引擎技术 5 2.1 30分钟实现的搜索引擎 5 2.1.1 准备工作环境(10分钟) 5 2.1.2 编写代码(15分钟) 6 2.1.3 发布运行(5分钟) 9 2.2 搜索引擎基本技术 14 2.2.1 网络蜘蛛 14 2.2.2 全文索引结构 14 2.2.3 Lucene 全文检索引擎 15 2.2.4 Nut
  3. 所属分类:Java

    • 发布日期:2012-04-25
    • 文件大小:3145728
    • 提供者:jayghost
  1. 彗星小助手

  2. 彗星小助手窗口SPY,探测、操作外部窗口 彗星小助手基于 Win32 的实用工具,它提供系统的进程、线程、窗口和窗口消息的图形视图。使用窗口SPY可以执行下列操作: 显示系统对象(包括进程、线程和窗口)之间关系的图形树。 搜索指定的窗口、线程、进程或消息... 网页SPY,探测资源、解除限制网页 在线分析和修改器,它可以分析Microsoft Internet Explorer或是嵌套在应用程序中的浏览器窗口中正在浏览的网页内容,在保持连线状态下实时地修改它。通过使用网页SPY,你可以针对网页
  3. 所属分类:C++

    • 发布日期:2012-08-28
    • 文件大小:1048576
    • 提供者:yth796
  1. NetPad

  2. 在信息快速发展的今天,如何更有效率的获取网络资源已成为网上查阅资料的一种技术,每天都会有大量的日报、晚报 快报发行,每周都又会有周报发行,每半月或一月的半月刊或月刊发行。这还不包括网络每日的资料更新。这么多的资 源信息,如何利用更有效率更快捷的手法获取呢?NetPad 便能轻松解决此问题,它将使您在海量的信息中解脱出来,更 加有效的利用自己有限的时间获取更多有用的网络资源. 同时此软件费用将是免费的。如果您愿意帮助作者进一步开发,请查阅联系作者。 NetPad 拥有如下功能: (* 表示用户可
  3. 所属分类:网络基础

    • 发布日期:2006-08-30
    • 文件大小:829440
    • 提供者:chsaler
  1. 可扩展Web信息搜集系统的设计

  2. 网络环境下海量信息组织与处理的理论与方法研究”的一部分;研究对象是Web这样的动态海量信息载体;研究的主要目标是要得到一种高性能、高可靠,支持海量网页信息搜集、分析与处理的系统结构。
  3. 所属分类:Web开发

    • 发布日期:2014-01-26
    • 文件大小:1048576
    • 提供者:yes914185580
  1. 海量的基于Web的FTP搜索引擎系统的设计与实现

  2. 学习设计搜索引擎的好东西!本文详细解释了搜索引擎设计实现的各个过程,已经使用到哪些技术!
  3. 所属分类:Web开发

    • 发布日期:2008-11-14
    • 文件大小:4194304
    • 提供者:gredn
  1. 横瓜硬盘搜索引擎 v3.2 免费版.zip

  2. 横瓜硬盘搜索引擎是基于Windows平台的硬盘搜索,最大容量可检索1000万硬盘文件名。对于存有10万个文件规模的硬盘,可在50秒内完成所有架构工作。横瓜硬盘搜索,扫描文件速度约2000个文件/秒,分词速度2500万字/分钟,平均检索时间小于0.001秒。横瓜硬盘搜索PC硬件配置,需要700M内存、空闲硬盘空间1G、文件系统NTFS。横瓜硬盘搜索引擎采用横瓜分布式Map数据库技术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、 硬盘整理加速技术、疑似垂直
  3. 所属分类:其它

    • 发布日期:2019-07-15
    • 文件大小:3145728
    • 提供者:weixin_39841856
  1. 基于Java的搜索引擎技术在Web信息挖掘中的应用

  2. 为了快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用,采用搜索引擎技术,借鉴Web挖掘技术解决用户检索网络信息的困难。同时探讨搜索引擎技术在网络信息挖掘方面的应用,重点研究网络爬行器技术,给出了Linux下Java语言实现简陋Web爬虫代码。研究结果表明对于搜索引擎而言,通过借鉴Web挖掘技术,可以提高查准率和查全率,改善检索结果的组织,增强检索用户的模式研究,从而使得检索效率得到改善。该成果对Web信息挖掘有一定参考价值。
  3. 所属分类:其它

    • 发布日期:2020-06-02
    • 文件大小:790528
    • 提供者:weixin_38645434
« 12 3 »