点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - web网页正文
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
K风网页搜索系统(.NET) v2.2 源码
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; V2.1版本主要改
所属分类:
C#
发布日期:2010-10-31
文件大小:2097152
提供者:
yuanhongcs
Web信息采集中页面分块技术的研究
Web信息采集中页面分块技术的研究 通过去除网页中的噪音 从而提取出网页正文信息 即web信息
所属分类:
Web开发
发布日期:2011-04-27
文件大小:45056
提供者:
rmxqf123
基于web的网页链接与正文抽取技术研究
关于网页链接抽取的算法,网页正文的算法。
所属分类:
网络管理
发布日期:2011-06-14
文件大小:2097152
提供者:
invincible123
HTMLParser抽取Web网页正文信息.doc
HTMLParser抽取Web网页正文信息.doc
所属分类:
Java
发布日期:2011-08-18
文件大小:293888
提供者:
netebuilder
HTMLParser抽取Web网页正文信息
HTMLParser抽取Web网页正文信息
所属分类:
Java
发布日期:2012-04-01
文件大小:293888
提供者:
wwwlove1019w
网页正文提取工具boilerpipe1.2bin包
输入一个url或者string型的网页源码,通过该工具即可得到想要的正文信息,例如提取各大门户网站的新闻,历史,娱乐等的正文信息。网页正文提取工具,这是目前销量最高,提取一个网页正文信息只需要毫秒级的时间消耗,同时他的准确率已经是最高级别的,相信使用它之后你将得到享受级别的感受,很强大
所属分类:
Java
发布日期:2012-07-19
文件大小:1048576
提供者:
cuikai314
Web网页正文抽取方法研究
Web网页正文抽取方法研究 网页出噪声 Web网页正文抽取方法研究 网页出噪声
所属分类:
Web开发
发布日期:2012-09-18
文件大小:2097152
提供者:
xaiohuihong
写给Web开发人员看的HTML5教程
内容简介 《写给Web开发人员看的HTML5教程》通过结合大量实际案例和源代码对HTML5的重要特性进行了详细讲解,内容全面丰富,易于理解。全书共分为12章,从HTML5的历史故事讲起,涉及了文档结构和语义、智能表单、视频与音频、画布、SVG与MathML、地理定位、Web存储与离线Web应用程序、WebSockets套接字、Web Worker多线程、微数据以及以拖曳为代表的一些全局属性,涵盖了HTML5所有的重要特性。此外,《写给Web开发人员看的HTML5教程》还提供了大量的案例源代码,
所属分类:
Web开发
发布日期:2013-03-16
文件大小:24117248
提供者:
mazhaojuan
基于语义和规则的Web网页细粒度信息抽取方法
本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用语义和规则,确定属性和属性值对。实验证明,该方法逐步细化分解网页,有效的利用了网页潜在的语义信息,拥有不依赖网页类型、结构,适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
所属分类:
其它
发布日期:2013-03-30
文件大小:1048576
提供者:
zhangfei2018
web网页正文抽取方法研究
web网页正文抽取方法研究
所属分类:
其它
发布日期:2013-06-05
文件大小:2097152
提供者:
xiaolizhuo
HTMLParser抽取Web网页正文信息
一般在浏览Web上的网页时会发现两部分内容:一部分是网页的主题信息,另一部分则是与主题内容无关的导航条、广告信息、版权信息等内容,我们称之为“噪音”内容。通过提取主题信息可以减少一半浏览时间,提高用户获取信息的速度,从而增强Web的可用性
所属分类:
其它
发布日期:2013-11-26
文件大小:291840
提供者:
np163
Web新闻正文信息抽取技术研究
关于网页信息抽取技术的论文,本方法主要针对新闻页面正文 发布时间 转载情况的信息抽取
所属分类:
其它
发布日期:2014-03-01
文件大小:125952
提供者:
whlgh
基于语义和规则的Web网页细粒度信息抽取方法
本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用语义和规则,确定属性和属性值对。实验证明,该方法逐步细化分解网页,有效的利用了网页潜在的语义信息,拥有不依赖网页类型、结构,适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
所属分类:
专业指导
发布日期:2017-07-13
文件大小:1048576
提供者:
u012184337
基于行块分布函数的通用网页正文抽取
对于 Web 信息检索来说,网页正文抽取是后续处理的关键。虽然使用正则 表达式可以准确的抽取某一固定格式的页面,但面对形形色色的 HTML,使用规 则处理难免捉襟见肘。 能不能高效、准确的将一个页面的正文抽取出来,并做到在大规模网页范围 内通用,这是一个直接关系上层应用的难题。
所属分类:
算法与数据结构
发布日期:2017-11-24
文件大小:1048576
提供者:
u013263829
WebSpider 网页抓取 v5.1
网页抓取工具5.1可以抓取互联网、wap网站上的任何网页,包括需要登录后才能访问的页面。对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取,支持正文页多页合并,支持图片、文件的抓取,可以抓取静态网页,也可以抓取带参数的动态网页,功能极其强大。 用户指定要抓取的网站、抓取的网页类型(固定页面、分页显示的页面等等),并配置如何解析数据项(如新闻标题、作者、来源、正文等),系统可以根据配置信息自动实时抓取数据,启动抓取的时间也可以通过配置设定,真
所属分类:
网络基础
发布日期:2009-03-03
文件大小:16777216
提供者:
zbq1001
spider web抓取网页的蜘蛛
网页抓取工具5.1可以抓取互联网、wap网站上的任何网页,包括需要登录后才能访问的页面。对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取,支持正文页多页合并,支持图片、文件的抓取,可以抓取静态网页,也可以抓取带参数的动态网页,功能极其强大。 用户指定要抓取的网站、抓取的网页类型(固定页面、分页显示的页面等等),并配置如何解析数据项(如新闻标题、作者、来源、正文等),系统可以根据配置信息自动实时抓取数据,启动抓取的时间也可以通过配置设定,真
所属分类:
Web开发
发布日期:2009-03-08
文件大小:16777216
提供者:
q1a0
K风网页搜索 K-PageSearch v2.2 SP5.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP5:修正改进搜索算
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39840515
K风网页搜索系统(.NET) v2.2.rar
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;V2.1版本主要改进
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39841882
基于文本及符号密度的网页正文提取方法.7z
【转发】【引用】【论文】大多数的网站的网页除了主要的内容,还包含导航栏,广告,版权等无关信息。这些额外的内容亦被称为噪声,通常与主题无关。由于这些噪声会妨碍搜索引擎对 Web 数据的挖掘性能,所 以需要过滤噪声。在本文中,我们提出基于网页文本密度与符号密度对网页进行正文内容提取,这是一种快速,准确通用的网页提取算法,而且还可以保留原始结构。通过与现有的一些算法对 比,可以体现该算法的精确度,同时该算法可以较好的支持大数据量网页正文提取操作。
所属分类:
其它
发布日期:2021-03-24
文件大小:1048576
提供者:
wonderdaydream
基于文本及符号密度的网页正文提取方法
大多数的网站的网页除了主要的内容,还包含导航栏,广告,版权等无关信息。这些额外的内容亦被称为噪声,通常与主题无关。由于这些噪声会妨碍搜索引擎对Web数据的挖掘性能,所以需要过滤噪声。在本文中,我们提出基于网页文本密度与符号密度对网页进行正文内容提取,这是一种快速,准确通用的网页提取算法,而且还可以保留原始结构。通过与现有的一些算法对比,可以体现该算法的精确度,同时该算法可以较好的支持大数据量网页正文提取操作。
所属分类:
其它
发布日期:2021-01-13
文件大小:1048576
提供者:
weixin_38582685
«
1
2
3
»