您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. K风网页搜索系统(.NET) v2.2 源码

  2. K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; V2.1版本主要改
  3. 所属分类:C#

    • 发布日期:2010-10-31
    • 文件大小:2097152
    • 提供者:yuanhongcs
  1. Web信息采集中页面分块技术的研究

  2. Web信息采集中页面分块技术的研究 通过去除网页中的噪音 从而提取出网页正文信息 即web信息
  3. 所属分类:Web开发

    • 发布日期:2011-04-27
    • 文件大小:45056
    • 提供者:rmxqf123
  1. 基于web的网页链接与正文抽取技术研究

  2. 关于网页链接抽取的算法,网页正文的算法。
  3. 所属分类:网络管理

    • 发布日期:2011-06-14
    • 文件大小:2097152
    • 提供者:invincible123
  1. HTMLParser抽取Web网页正文信息.doc

  2. HTMLParser抽取Web网页正文信息.doc
  3. 所属分类:Java

    • 发布日期:2011-08-18
    • 文件大小:293888
    • 提供者:netebuilder
  1. HTMLParser抽取Web网页正文信息

  2. HTMLParser抽取Web网页正文信息
  3. 所属分类:Java

    • 发布日期:2012-04-01
    • 文件大小:293888
    • 提供者:wwwlove1019w
  1. 网页正文提取工具boilerpipe1.2bin包

  2. 输入一个url或者string型的网页源码,通过该工具即可得到想要的正文信息,例如提取各大门户网站的新闻,历史,娱乐等的正文信息。网页正文提取工具,这是目前销量最高,提取一个网页正文信息只需要毫秒级的时间消耗,同时他的准确率已经是最高级别的,相信使用它之后你将得到享受级别的感受,很强大
  3. 所属分类:Java

    • 发布日期:2012-07-19
    • 文件大小:1048576
    • 提供者:cuikai314
  1. Web网页正文抽取方法研究

  2. Web网页正文抽取方法研究 网页出噪声 Web网页正文抽取方法研究 网页出噪声
  3. 所属分类:Web开发

    • 发布日期:2012-09-18
    • 文件大小:2097152
    • 提供者:xaiohuihong
  1. 写给Web开发人员看的HTML5教程

  2. 内容简介 《写给Web开发人员看的HTML5教程》通过结合大量实际案例和源代码对HTML5的重要特性进行了详细讲解,内容全面丰富,易于理解。全书共分为12章,从HTML5的历史故事讲起,涉及了文档结构和语义、智能表单、视频与音频、画布、SVG与MathML、地理定位、Web存储与离线Web应用程序、WebSockets套接字、Web Worker多线程、微数据以及以拖曳为代表的一些全局属性,涵盖了HTML5所有的重要特性。此外,《写给Web开发人员看的HTML5教程》还提供了大量的案例源代码,
  3. 所属分类:Web开发

    • 发布日期:2013-03-16
    • 文件大小:24117248
    • 提供者:mazhaojuan
  1. 基于语义和规则的Web网页细粒度信息抽取方法

  2. 本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用语义和规则,确定属性和属性值对。实验证明,该方法逐步细化分解网页,有效的利用了网页潜在的语义信息,拥有不依赖网页类型、结构,适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
  3. 所属分类:其它

    • 发布日期:2013-03-30
    • 文件大小:1048576
    • 提供者:zhangfei2018
  1. web网页正文抽取方法研究

  2. web网页正文抽取方法研究
  3. 所属分类:其它

    • 发布日期:2013-06-05
    • 文件大小:2097152
    • 提供者:xiaolizhuo
  1. HTMLParser抽取Web网页正文信息

  2. 一般在浏览Web上的网页时会发现两部分内容:一部分是网页的主题信息,另一部分则是与主题内容无关的导航条、广告信息、版权信息等内容,我们称之为“噪音”内容。通过提取主题信息可以减少一半浏览时间,提高用户获取信息的速度,从而增强Web的可用性
  3. 所属分类:其它

    • 发布日期:2013-11-26
    • 文件大小:291840
    • 提供者:np163
  1. Web新闻正文信息抽取技术研究

  2. 关于网页信息抽取技术的论文,本方法主要针对新闻页面正文 发布时间 转载情况的信息抽取
  3. 所属分类:其它

    • 发布日期:2014-03-01
    • 文件大小:125952
    • 提供者:whlgh
  1. 基于语义和规则的Web网页细粒度信息抽取方法

  2. 本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用语义和规则,确定属性和属性值对。实验证明,该方法逐步细化分解网页,有效的利用了网页潜在的语义信息,拥有不依赖网页类型、结构,适用性好的优点。实验表明该方法提取正文细粒度精确度达到了90%。
  3. 所属分类:专业指导

    • 发布日期:2017-07-13
    • 文件大小:1048576
    • 提供者:u012184337
  1. 基于行块分布函数的通用网页正文抽取

  2. 对于 Web 信息检索来说,网页正文抽取是后续处理的关键。虽然使用正则 表达式可以准确的抽取某一固定格式的页面,但面对形形色色的 HTML,使用规 则处理难免捉襟见肘。 能不能高效、准确的将一个页面的正文抽取出来,并做到在大规模网页范围 内通用,这是一个直接关系上层应用的难题。
  3. 所属分类:算法与数据结构

    • 发布日期:2017-11-24
    • 文件大小:1048576
    • 提供者:u013263829
  1. WebSpider 网页抓取 v5.1

  2. 网页抓取工具5.1可以抓取互联网、wap网站上的任何网页,包括需要登录后才能访问的页面。对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取,支持正文页多页合并,支持图片、文件的抓取,可以抓取静态网页,也可以抓取带参数的动态网页,功能极其强大。 用户指定要抓取的网站、抓取的网页类型(固定页面、分页显示的页面等等),并配置如何解析数据项(如新闻标题、作者、来源、正文等),系统可以根据配置信息自动实时抓取数据,启动抓取的时间也可以通过配置设定,真
  3. 所属分类:网络基础

    • 发布日期:2009-03-03
    • 文件大小:16777216
    • 提供者:zbq1001
  1. spider web抓取网页的蜘蛛

  2. 网页抓取工具5.1可以抓取互联网、wap网站上的任何网页,包括需要登录后才能访问的页面。对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取,支持正文页多页合并,支持图片、文件的抓取,可以抓取静态网页,也可以抓取带参数的动态网页,功能极其强大。 用户指定要抓取的网站、抓取的网页类型(固定页面、分页显示的页面等等),并配置如何解析数据项(如新闻标题、作者、来源、正文等),系统可以根据配置信息自动实时抓取数据,启动抓取的时间也可以通过配置设定,真
  3. 所属分类:Web开发

    • 发布日期:2009-03-08
    • 文件大小:16777216
    • 提供者:q1a0
  1. K风网页搜索 K-PageSearch v2.2 SP5.rar

  2. K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP5:修正改进搜索算
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:2097152
    • 提供者:weixin_39840515
  1. K风网页搜索系统(.NET) v2.2.rar

  2. K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;V2.1版本主要改进
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:2097152
    • 提供者:weixin_39841882
  1. 基于文本及符号密度的网页正文提取方法.7z

  2. 【转发】【引用】【论文】大多数的网站的网页除了主要的内容,还包含导航栏,广告,版权等无关信息。这些额外的内容亦被称为噪声,通常与主题无关。由于这些噪声会妨碍搜索引擎对 Web 数据的挖掘性能,所 以需要过滤噪声。在本文中,我们提出基于网页文本密度与符号密度对网页进行正文内容提取,这是一种快速,准确通用的网页提取算法,而且还可以保留原始结构。通过与现有的一些算法对 比,可以体现该算法的精确度,同时该算法可以较好的支持大数据量网页正文提取操作。
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:1048576
    • 提供者:wonderdaydream
  1. 基于文本及符号密度的网页正文提取方法

  2. 大多数的网站的网页除了主要的内容,还包含导航栏,广告,版权等无关信息。这些额外的内容亦被称为噪声,通常与主题无关。由于这些噪声会妨碍搜索引擎对Web数据的挖掘性能,所以需要过滤噪声。在本文中,我们提出基于网页文本密度与符号密度对网页进行正文内容提取,这是一种快速,准确通用的网页提取算法,而且还可以保留原始结构。通过与现有的一些算法对比,可以体现该算法的精确度,同时该算法可以较好的支持大数据量网页正文提取操作。
  3. 所属分类:其它

    • 发布日期:2021-01-13
    • 文件大小:1048576
    • 提供者:weixin_38582685
« 12 3 »