搜索资源 - web网页正文 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - web网页正文

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

K风网页搜索系统(.NET) v2.2 源码
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度； V2.1版本主要改
所属分类：C#
- 发布日期：2010-10-31
- 文件大小：2097152
- 提供者：yuanhongcs

Web信息采集中页面分块技术的研究
Web信息采集中页面分块技术的研究通过去除网页中的噪音从而提取出网页正文信息即web信息
所属分类：Web开发
- 发布日期：2011-04-27
- 文件大小：45056
- 提供者：rmxqf123

基于web的网页链接与正文抽取技术研究
关于网页链接抽取的算法，网页正文的算法。
所属分类：网络管理
- 发布日期：2011-06-14
- 文件大小：2097152
- 提供者：invincible123

HTMLParser抽取Web网页正文信息.doc
HTMLParser抽取Web网页正文信息.doc
所属分类：Java
- 发布日期：2011-08-18
- 文件大小：293888
- 提供者：netebuilder

HTMLParser抽取Web网页正文信息
HTMLParser抽取Web网页正文信息
所属分类：Java
- 发布日期：2012-04-01
- 文件大小：293888
- 提供者：wwwlove1019w

网页正文提取工具boilerpipe1.2bin包
输入一个url或者string型的网页源码，通过该工具即可得到想要的正文信息，例如提取各大门户网站的新闻，历史，娱乐等的正文信息。网页正文提取工具，这是目前销量最高，提取一个网页正文信息只需要毫秒级的时间消耗，同时他的准确率已经是最高级别的，相信使用它之后你将得到享受级别的感受，很强大
所属分类：Java
- 发布日期：2012-07-19
- 文件大小：1048576
- 提供者：cuikai314

Web网页正文抽取方法研究
Web网页正文抽取方法研究网页出噪声 Web网页正文抽取方法研究网页出噪声
所属分类：Web开发
- 发布日期：2012-09-18
- 文件大小：2097152
- 提供者：xaiohuihong

写给Web开发人员看的HTML5教程
内容简介《写给Web开发人员看的HTML5教程》通过结合大量实际案例和源代码对HTML5的重要特性进行了详细讲解，内容全面丰富，易于理解。全书共分为12章，从HTML5的历史故事讲起，涉及了文档结构和语义、智能表单、视频与音频、画布、SVG与MathML、地理定位、Web存储与离线Web应用程序、WebSockets套接字、Web Worker多线程、微数据以及以拖曳为代表的一些全局属性，涵盖了HTML5所有的重要特性。此外，《写给Web开发人员看的HTML5教程》还提供了大量的案例源代码，
所属分类：Web开发
- 发布日期：2013-03-16
- 文件大小：24117248
- 提供者：mazhaojuan

基于语义和规则的Web网页细粒度信息抽取方法
本文在利用语义和规则的基础上，提出了一个Web网页信息细粒度抽取的方法。方法首先，利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取；其次，结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割，形成语义上紧密相关的标识文本；然后，根据语义解释器，依次识别出文本中的属性项；最后利用语义和规则，确定属性和属性值对。实验证明，该方法逐步细化分解网页，有效的利用了网页潜在的语义信息，拥有不依赖网页类型、结构，适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
所属分类：其它
- 发布日期：2013-03-30
- 文件大小：1048576
- 提供者：zhangfei2018

web网页正文抽取方法研究
web网页正文抽取方法研究
所属分类：其它
- 发布日期：2013-06-05
- 文件大小：2097152
- 提供者：xiaolizhuo

HTMLParser抽取Web网页正文信息
一般在浏览Web上的网页时会发现两部分内容：一部分是网页的主题信息，另一部分则是与主题内容无关的导航条、广告信息、版权信息等内容，我们称之为“噪音”内容。通过提取主题信息可以减少一半浏览时间，提高用户获取信息的速度，从而增强Web的可用性
所属分类：其它
- 发布日期：2013-11-26
- 文件大小：291840
- 提供者：np163

Web新闻正文信息抽取技术研究
关于网页信息抽取技术的论文，本方法主要针对新闻页面正文发布时间转载情况的信息抽取
所属分类：其它
- 发布日期：2014-03-01
- 文件大小：125952
- 提供者：whlgh

基于语义和规则的Web网页细粒度信息抽取方法
本文在利用语义和规则的基础上，提出了一个Web网页信息细粒度抽取的方法。方法首先，利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取；其次，结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割，形成语义上紧密相关的标识文本；然后，根据语义解释器，依次识别出文本中的属性项；最后利用语义和规则，确定属性和属性值对。实验证明，该方法逐步细化分解网页，有效的利用了网页潜在的语义信息，拥有不依赖网页类型、结构，适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
所属分类：专业指导
- 发布日期：2017-07-13
- 文件大小：1048576
- 提供者：u012184337

基于行块分布函数的通用网页正文抽取
对于 Web 信息检索来说，网页正文抽取是后续处理的关键。虽然使用正则表达式可以准确的抽取某一固定格式的页面，但面对形形色色的 HTML，使用规则处理难免捉襟见肘。能不能高效、准确的将一个页面的正文抽取出来，并做到在大规模网页范围内通用，这是一个直接关系上层应用的难题。
所属分类：算法与数据结构
- 发布日期：2017-11-24
- 文件大小：1048576
- 提供者：u013263829

WebSpider 网页抓取 v5.1
网页抓取工具5.1可以抓取互联网、wap网站上的任何网页，包括需要登录后才能访问的页面。对抓取到页面内容进行解析，得到结构化的信息，比如：新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取，支持正文页多页合并，支持图片、文件的抓取，可以抓取静态网页，也可以抓取带参数的动态网页，功能极其强大。用户指定要抓取的网站、抓取的网页类型（固定页面、分页显示的页面等等），并配置如何解析数据项（如新闻标题、作者、来源、正文等），系统可以根据配置信息自动实时抓取数据，启动抓取的时间也可以通过配置设定，真
所属分类：网络基础
- 发布日期：2009-03-03
- 文件大小：16777216
- 提供者：zbq1001

spider web抓取网页的蜘蛛
网页抓取工具5.1可以抓取互联网、wap网站上的任何网页，包括需要登录后才能访问的页面。对抓取到页面内容进行解析，得到结构化的信息，比如：新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取，支持正文页多页合并，支持图片、文件的抓取，可以抓取静态网页，也可以抓取带参数的动态网页，功能极其强大。用户指定要抓取的网站、抓取的网页类型（固定页面、分页显示的页面等等），并配置如何解析数据项（如新闻标题、作者、来源、正文等），系统可以根据配置信息自动实时抓取数据，启动抓取的时间也可以通过配置设定，真
所属分类：Web开发
- 发布日期：2009-03-08
- 文件大小：16777216
- 提供者：q1a0

K风网页搜索 K-PageSearch v2.2 SP5.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度； SP5：修正改进搜索算
所属分类：其它
- 发布日期：2019-07-09
- 文件大小：2097152
- 提供者：weixin_39840515

K风网页搜索系统(.NET) v2.2.rar
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统，拥有先进的智能分析和海量数据检索技术，核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构，支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品，为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进：改进索引系统读写性能，提高约10倍的索引速度；V2.1版本主要改进
所属分类：其它
- 发布日期：2019-07-09
- 文件大小：2097152
- 提供者：weixin_39841882

基于文本及符号密度的网页正文提取方法.7z
【转发】【引用】【论文】大多数的网站的网页除了主要的内容，还包含导航栏，广告，版权等无关信息。这些额外的内容亦被称为噪声，通常与主题无关。由于这些噪声会妨碍搜索引擎对 Web 数据的挖掘性能，所以需要过滤噪声。在本文中，我们提出基于网页文本密度与符号密度对网页进行正文内容提取，这是一种快速，准确通用的网页提取算法，而且还可以保留原始结构。通过与现有的一些算法对比，可以体现该算法的精确度，同时该算法可以较好的支持大数据量网页正文提取操作。
所属分类：其它
- 发布日期：2021-03-24
- 文件大小：1048576
- 提供者：wonderdaydream

基于文本及符号密度的网页正文提取方法
大多数的网站的网页除了主要的内容，还包含导航栏，广告，版权等无关信息。这些额外的内容亦被称为噪声，通常与主题无关。由于这些噪声会妨碍搜索引擎对Web数据的挖掘性能，所以需要过滤噪声。在本文中，我们提出基于网页文本密度与符号密度对网页进行正文内容提取，这是一种快速，准确通用的网页提取算法，而且还可以保留原始结构。通过与现有的一些算法对比，可以体现该算法的精确度，同时该算法可以较好的支持大数据量网页正文提取操作。
所属分类：其它
- 发布日期：2021-01-13
- 文件大小：1048576
- 提供者：weixin_38582685

« 12 3 »