搜索资源 - 网页相关度 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 网页相关度

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

海量Web信息搜集系统优化设计_谢正茂_北京大学硕士论文
论文摘要本文首先由WWW的起源和发展导出搜索引擎技术的出现和发展。北大天网是这类技术在中国的最早的成功产品之一，本文将大体介绍其体系结构和技术特点。搜集端（crawler）是天网的主要模块之一，它的搜索速度、获取网页质量是评价搜索引擎好坏的主要指标，是检索端的工作的基石。如何更快，更好的抓取网页是本人毕业设计的工作目标。在介绍完搜集端现有的体系结构之后，本文从搜索导向、相似网页、相关度权值给定三个方面阐述它的优化策略，作为本文的重点。最后，本文试图指出现有系统的处理能力极限和瓶颈，
所属分类：Web开发
- 发布日期：2009-07-08
- 文件大小：228352
- 提供者：rockychan1206

基于浅层分析的网页相关度研究
摘要本文介绍了北京大学天网知名度系统的设计与开发工作，重点论述了其中网页相关度评价的因素、算法和相应的检索结果。系统在北京大学天网搜索引擎的基础上，运用中文信息提取的新技术，结合网页信息的特点，针对名人网页的检索提出了一种新的网页相关度评价算法，改善了检索结果的排序合理性，提高了名人网页检索服务的质量。
所属分类：其它
- 发布日期：2009-07-22
- 文件大小：83968
- 提供者：flydi

基于本体语义的定题爬虫
:定题爬虫能迅速获取网络上特定主题的大量信息,对专业搜索引擎及数据挖掘应用都具有重大价值. 针对目前通用的基于关键词主题过滤策略的不足,在概念聚集思想启发下,提出了基于本体语义的主题过滤策略. 同时根据网页具有不同位置不同信息重要性的特点,提出了改进的加权特征项权值计算公式,实现基于语义的网页实时过滤. 为进一步提高爬虫的工作效率提出链接相关度预测算法. 对比实验表明此策略具有可行性.
所属分类：网络基础
- 发布日期：2009-12-17
- 文件大小：191488
- 提供者：haozsp

综合检索报告单片机的应用
1、中文期刊5篇 2、外文期刊找5篇 3、专利文献中外文各找2篇 4、学位论文中外文各找2篇 5、标准文献1篇 6. 产品样本:只提供图,商品名:厂家.联系方式. 7. 网络上相关网页(10页) (只列题名，IP地址.)(注意相关度 8、会议论文（2篇） 9.中外文电子图书（相关专业）各3种，说明来源，格式，书名，作者，标准书号，有无全文。
所属分类：硬件开发
- 发布日期：2010-03-29
- 文件大小：260096
- 提供者：wang_angle

基于本体的网络爬虫技术研究
互联网已经成为最大的非结构化数据库，极大方便了信息访问。然而，网络上的信息大多都是无组织的，由于网络的分布式特性，很难对它进行信息和知识管理。因此，如何建立一个智能的信息发现机制很有必要。本文在分析了爬虫工作原理和传统算法后，提出了一种基于本体的网络爬虫的信息发现框架。该框架包含了预处理模块和本体管理模块，定义了网页相关度计算策略，最后通过实验对该框架进行了评估。
所属分类：网络基础
- 发布日期：2010-09-15
- 文件大小：158720
- 提供者：yerida

基于DIV的主题抽取
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV 标签把HTML文档解析成DIV森林,然后过滤掉DW标签树中的噪声结点并且建立STU-DIV模型树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树。通过对多个新闻网站的网页进行分析处理,实验证明此方法能够有效地抽取新闻网页的主题信息。
所属分类：其它
- 发布日期：2010-12-30
- 文件大小：373760
- 提供者：heyun51

基于浅层分析的网页相关度研究
基于浅层分析的网页相关度研究
所属分类：专业指导
- 发布日期：2008-05-13
- 文件大小：272384
- 提供者：shuizimuzhongling

搜索引擎代码
E桶金行业搜索引擎系统（包含多线程客户端蜘蛛系统） V1.6 版发布！ E桶金行业搜索引擎特别适用于超大、中型信息门户、行业门户、电子商务等网站使用。它是一款真正意义上的搜索引擎:具有自己的蜘蛛、分词、索引、搜索等全套功能。而且所有功能全部基于web页面完成，您只需要购买一款支持asp.net的虚拟主机就能完成本程序的部署，网站轻松上线。本程序具有毫秒级高速搜索, 搜索结果相关度排序。多关键词搜索、超长词条搜索、关键词高亮显示。该程序为ASP.NET2.0版本程序，只要空间支持as
所属分类：C#
- 发布日期：2011-09-19
- 文件大小：8388608
- 提供者：ntk2006

Web Data Mining (英文)
目录回到顶部↑ 第一部分数据挖掘基础. 第1章概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
所属分类：专业指导
- 发布日期：2012-05-02
- 文件大小：8388608
- 提供者：chen_767

百度指数查询工具2013.v2.0
易佰关键词查询工具2013 V2.0 是针对站长，企业营销人员，及SEO人士的一款的关键词挖掘工具，能够帮助用户快速查询相关的关键词，同时能够批量分析关键词的热度（百度指数），竞争度（网页收录量，竞争对手，竞价广告）等。该软件支持如下功能： 1) 包括百度搜索，谷歌搜索，搜搜搜索，搜狗搜索，雅虎搜索，必应搜索，有道搜索，即刻搜索，360搜索等几乎所有主流搜索平台的关键词查询。 2) 包括淘宝网，京东商城，当当网，拍拍网，亚马逊，阿里巴巴等几乎所有主流电商平台的关键词查询。 3) 支持百度指数
所属分类：其它
- 发布日期：2013-07-23
- 文件大小：1048576
- 提供者：guyan999

易佰关键词挖掘工具2013 v2.5.2
易佰关键词查询工具2013 V2.5.2 是针对站长，企业营销人员，及SEO人士的一款的关键词快速挖掘工具，能够帮助用户快速查询相关的关键词，同时能够批量分析关键词的热度（百度指数），竞争度（网页收录量，竞争对手，竞价广告）等。该软件支持如下功能： 1) 包括百度搜索，谷歌搜索，搜搜搜索，搜狗搜索，雅虎搜索，必应搜索，有道搜索，即刻搜索，360搜索等几乎所有主流搜索平台的关键词查询。 2) 包括淘宝网，天猫，京东商城，当当网，拍拍网，亚马逊，阿里巴巴等几乎所有主流电商平台的关键词查询。 3)
所属分类：网络基础
- 发布日期：2013-08-24
- 文件大小：2097152
- 提供者：guyan999

基于机器学习的网页正文提取方法
先将网页转换为规范的 DOM 树然后计算每行文本的文本密度与标题相关度等值并将其作为输入参数利用 BP 神经网络进行训练进而形成抽取规则最后通过实验验证该方法的可行性
所属分类：其它
- 发布日期：2014-03-01
- 文件大小：174080
- 提供者：whlgh

信息检索复习范围
可以快速复习 10.描述LSI模型 11.实例分析VSM模型 12.信息检索系统常见的索引技术有哪些，各自的使用场合如何？ 13.实例分析倒排索引 14.信息检索查询处理的基本过程 15.什么是相关度反馈 16.实例计算相关度反馈的查询重写 17.分析违反馈和隐反馈 18.查询扩展的方法有哪些 19.描述网络爬虫系统 20.网页预处理的过程有哪些 21.描述pagerank算法 22.描述hits算法 24.文本分类系统中，特征选择有哪些方法，优缺点方法如何？
所属分类：网络管理
- 发布日期：2014-06-26
- 文件大小：573
- 提供者：zhaodouddou

面向垂直搜索引擎的主题爬行技术研究
垂直搜索；主题爬行；主题描述；网页分块；相关度计算；相关度预测；优先级计算。
所属分类：Web开发
- 发布日期：2015-01-21
- 文件大小：9437184
- 提供者：jlumarvin

2016大数据技术大会
2016大数据技术大会，来自一线互联网（含bat）厂商顶级大学的大数据实践经验，包含以下主题：百度大规模推荐系统实践京东数据库备份系统进化之路腾讯大数据能力输出之路基于图算法的跨设备受众识别 360聚效广告大数据平台实践领域知识驱动的个性化推荐方法大数据基础组建的安全解决方案大数据视野下的数据安全防护体系探索大数据安全防护 ARM嵌入式系统的DNN性能优化 Gemini：基于图计算的高性能大数据分析系统下一代实时数据处理引擎——Apache Apex项目
所属分类：专业指导
- 发布日期：2017-03-09
- 文件大小：78643200
- 提供者：dreamfarwhb

易搜索站内全文检索搜索引擎
导航的根源在于分类，当有100条信息的时候，我们使用类别来定位信息，当有10000条信息的时候，我们用标签来定位信息，当有100..00条信息的时候，无论怎么分类都是难以寻找的，于是就有了搜索… 当一个网站信息越积越多，搜索将会变得越来越重要。以至于终于有一天，当网站发现50%以上的用户来到你的网站第一件事是搜索的时候，搜索就将成为没有“导航”的导航。因此站内搜索成了网站建设的当务之急。随着网络应用的深入，信息量的爆炸性增长，站内搜索成为每个优秀网站必须具备的功能。纵观中国大中小网站，绝大多数
所属分类：其它
- 发布日期：2008-12-27
- 文件大小：228352
- 提供者：redmethod

主题网络爬虫
网络爬虫是一种能够自动采集互联网信息的程序。网络爬虫不但能够作为搜索引擎的采集器，而且可以用于特定信息的采集，根据某些特定的要求采集网站中的信息，如就业，租房信息等。本文设计并实现了一种基于主题的网络爬虫程序。网络爬虫采用何种搜索策略和如何评价当前页面的主题相关度是基于主题的网络爬虫需要解决的关键问题。本文设计的网络爬虫采用广度优先搜索，对url进行解析、去重等。并应用Java多线程，使爬虫在抓取网页的过程中更有效率。通常评价页面相关度是采用基于内容评价的搜索策略，本文实现了三个常用的相关度评
所属分类：Java
- 发布日期：2018-08-18
- 文件大小：35840
- 提供者：qq_43000290

K风网页搜索 K-PageSearch v2.2 SP5.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度； SP5：修正改进搜索算
所属分类：其它
- 发布日期：2019-07-09
- 文件大小：2097152
- 提供者：weixin_39840515

\"Tag-TextRank：一种基于Tag的网页关键词抽取方法\"分享总结
NULL 博文链接：https://snv.iteye.com/blog/1886969在 Wikipedia中的实体,并且算法的复杂度很高。另外,国内一些学者lm2也开展了关键词提取的研究。实际上,从上面的工作,我们可以得到这样的基本结论:基本的R特征可以找到部分关键词,而加入用户信息或者领域知识可以进一步提高关键词抽取效果。本文利用Tag信息来提高关键词的抽取效果。近年来,Tag数据作为·种新的资源, 其挖掘和利用已经成为信息检索、社区发现等领域的研究热点。从数据质量上讲,Iag数据
所属分类：其它
- 发布日期：2019-04-20
- 文件大小：1046528
- 提供者：weixin_38669628

基于机器学习的网页正文提取方法
先将网页转换为规范的DOM树，然后计算每行文本的文本密度、与标题相关度等值，并将其作为输入参数利用BP神经网络进行训练，进而形成抽取规则，最后通过实验验证该方法的可行性。
所属分类：其它
- 发布日期：2020-10-26
- 文件大小：145408
- 提供者：weixin_38748580

« 12 »