您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. JSp网络蜘蛛采集程序

  2. 一个JSp仿网络蜘蛛爬行程序,可以抓取或是采集指定网页的内容,这是一个可供学习的参考示例,完成了JSP采集的基本原理功能,你可以做为一个参考。
  3. 所属分类:Java

    • 发布日期:2009-08-12
    • 文件大小:2097152
    • 提供者:jjh371898307
  1. 新闻采集 数据采集 本地搜索引擎案例

  2. 规则定义:通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 数据保存:数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应 计划任务:通过这个功能可以让你的采集任务定时或者一直循环执行。 网页正文提取:可以将正文从网页htm代码中提取出来并进行适当的格式转换,并自动删除无用的htm代码。 采集结果分类:可以根据用户定义的分类信息进行采集结果的自动分类。 过滤重复内容:自动删除重复内容。 数据发布:可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。
  3. 所属分类:其它

    • 发布日期:2010-04-23
    • 文件大小:365568
    • 提供者:changyuanaccp
  1. 文档批量智能采集器软件

  2. 软件功能:可用多任务多线程方式采集任何网页上的任何指定文本内容,并进行你需要的相应过滤和处理,可以用搜索关键词方式采集需要的指定搜索结果..
  3. 所属分类:其它

    • 发布日期:2010-09-24
    • 文件大小:140288
    • 提供者:zjh19821120
  1. 网页数据采集器-支持ACCESS、SQLSERVER、MYSQL数据库

  2. 可同时采集任何内容 除了最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等;强大的信息自动再加工能力 你可以在配置任务的时候,指定对采集到的内容进行任何的替换、筛选。 支持实时保存到数据库 支持ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支持更多类型的数据库)。
  3. 所属分类:其它

    • 发布日期:2011-03-03
    • 文件大小:2097152
    • 提供者:wangyi198788
  1. 多线程、高性能采集器爬虫.net版源码,可采ajax页面

  2. 1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
  3. 所属分类:C#

    • 发布日期:2011-12-20
    • 文件大小:1048576
    • 提供者:andylaufzf
  1. 采集工具_采集软件_熊猫智能采集助手

  2. 熊猫采集软件是新一代采集软件,全程可视化视窗鼠标操作,用户无需关心网页源码,无需编写采集规则,无需使用正则表达式技术,全程智能化辅助,是采集软件行业的换代产品。同时也是通用性采集软件,可以应用在各个行业,满足各种采集需求。是复杂采集需求的必选,也是采集软件使用新手的首先。 熊猫采集软件的设计目标之一,是作为通用的垂直搜索引擎,配合熊猫的分词索引检索引擎,用户可以轻松构建自己的行业垂直搜索引擎,如招聘人才、房产、购物、医疗健康、二手、分类信息、商务、交友、论坛、博客、新闻、经验、知识、软件等等,
  3. 所属分类:互联网

    • 发布日期:2012-03-13
    • 文件大小:2097152
    • 提供者:diandianuu
  1. 简单的网页内容采集器

  2. 预览图片见:http://www.cnblogs.com/xxpyeippx/archive/2008/03/31/1131211.html运行环境windows nt/xp/2003 or above.net Framework 1.1SqlServer 2000 开发环境 VS 2003目的学习了网络编程,总要做点什么东西才好。于是想到要做一个网页内容采集器。作者主页: http://www.fltek.com.cn使用方式测试数据采用自cnBlog。见下图用户首先填写“起始网页”,即从哪
  3. 所属分类:C#

    • 发布日期:2012-04-09
    • 文件大小:52224
    • 提供者:jonny_jun_gao
  1. 多线程、高性能采集器爬虫.net版源码

  2. 1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
  3. 所属分类:C#

    • 发布日期:2012-08-27
    • 文件大小:1048576
    • 提供者:dream_boy
  1. 新闻采集 数据采集 本地搜索引擎案例

  2. 规则定义:通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 数据保存:数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应 计划任务:通过这个功能可以让你的采集任务定时或者一直循环执行。 网页正文提取:可以将正文从网页htm代码中提取出来并进行适当的格式转换,并自动删除无用的htm代码。 采集结果分类:可以根据用户定义的分类信息进行采集结果的自动分类。 过滤重复内容:自动删除重复内容。 数据发布:可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。
  3. 所属分类:其它

    • 发布日期:2012-11-06
    • 文件大小:365568
    • 提供者:anjun97
  1. JSp网络蜘蛛采集程序

  2. 内容索引:JSP源码,其它类别,JSP采集程序   一个JSp仿网络蜘蛛爬行程序,可以抓取或是采集指定网页的内容,这是一个可供学习的参考示例,完成了JSP采集的基本原理功能,你可以做为一个参考。
  3. 所属分类:Web开发

    • 发布日期:2012-11-28
    • 文件大小:2097152
    • 提供者:frank1061226
  1. AMR采集系统(原万用小偷程序) v3.1

  2. AMR采集系统(原万用小偷)是一个帮助广大草根站长快速丰富网站内容,以提高网站流量的web应用程序。 AMR自动采集系统(原万用小偷程序)是一款全自动采集网站的web应用程序,目前支持95%以上的网站采集。 相对于市面上其他小偷程序或采集工具,本程序具有如下特点: 1. 安装方便、使用简单:只需输入想要采集的目标站网址信息,即可将目标站内容自动采集过来;通过配置替换规则,修改CSS即可定制化网站布局和内容; 2. 支持静态生成、并按需更新静态:只有用户(包括搜索引擎)访问的页面才会被采集,并且
  3. 所属分类:C#

    • 发布日期:2013-01-10
    • 文件大小:1048576
    • 提供者:harry125
  1. 多线程、高性能采集器爬虫.net版源码,可采ajax页面

  2. 1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
  3. 所属分类:C#

    • 发布日期:2013-06-23
    • 文件大小:1048576
    • 提供者:wxlong8888168
  1. 多线程、高性能采集器爬虫.net版源码,可采ajax页面

  2. 1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
  3. 所属分类:C#

    • 发布日期:2014-07-02
    • 文件大小:1048576
    • 提供者:hamjolley1234
  1. 多线程、高性能采集器爬虫.net版源码,可采ajax页面

  2. 1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
  3. 所属分类:Web开发

    • 发布日期:2015-03-02
    • 文件大小:1048576
    • 提供者:tytok
  1. JSp网络采集程序.rar

  2. JSp网络采集程序,可以抓取或是采集指定网页的内容,完成了JSP采集的基本原理功能。
  3. 所属分类:其它

    • 发布日期:2019-07-10
    • 文件大小:2097152
    • 提供者:weixin_39840924
  1. VC 抓取指定网页的源代码.rar

  2. VC 抓取指定网页的源代码,抓取远程指定URL地址中包括的文件,并显示出网页源代码,实现了类似“采集”的功能,将远程网页的内容先读取出来,然后显示,由此可扩展成一个采集模块,添加过滤功能即可,要用到字符串处理相关编程技巧,本程序只是一个远程读取文件的雏形,仅供参考。相关代码片段:   //让控件和对应的变量之间进行数据交换,现在将控件数据传给对应变量   UpdateData(true);   //m_SiteInfo为控件ID_EDIT_CONTENT读应的变量   m_SiteInfo="
  3. 所属分类:其它

    • 发布日期:2019-07-10
    • 文件大小:19456
    • 提供者:weixin_39841848
  1. 小蚂蚁网页采集伪原创工具 v2.0.zip

  2. 小蚂蚁网页采集伪原创工具是一套智能采集和伪原创系统,关键词采集,相比火车头采集,不用写复杂的采集规则!其能根据指定的关键词全自动采集内容和伪原创,自动添加锚文本。 小蚂蚁网页采集伪原创工具不仅将站长从复制采集中解脱出来,更能有效增加网站收录和搜索引擎流量,是建站赚钱的必备工具,本软件可以作为一些*软件的辅助工具,也可以把采集的内容手动发布到你的网站! 小蚂蚁网页采集伪原创工具 v2.0更新: 1,修复了同时只能采集一个关键词的BUG! 2增加UBB链接,TXT格式功能。
  3. 所属分类:其它

    • 发布日期:2019-07-15
    • 文件大小:640000
    • 提供者:weixin_39840387
  1. PHP 采集获取指定网址的内容

  2. 用php来获取指定网页内容的实现代码,一般采集程序经常用的一些代码,这里只是一个简单的基础。更详细的资料可以参考php 采集成品,可以使用的源码,这样才能学会更多的东西。
  3. 所属分类:其它

    • 发布日期:2020-10-29
    • 文件大小:34816
    • 提供者:weixin_38632006
  1. python使用自定义user-agent抓取网页的方法

  2. 本文实例讲述了python使用自定义user-agent抓取网页的方法。分享给大家供大家参考。具体如下: 下面python代码通过urllib2抓取指定的url的内容,并且使用自定义的user-agent,可防止网站屏蔽采集器 import urllib2 req = urllib2.Request('http://192.168.1.2/') req.add_header('User-agent', 'Mozilla 5.10') res = urllib2.urlopen(req) htm
  3. 所属分类:其它

    • 发布日期:2020-12-24
    • 文件大小:28672
    • 提供者:weixin_38638799
  1. python 采集中文乱码问题的完美解决方法

  2. 近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录 1. 在正常情况下..可以用 import chardet thischarset = chardet.detect(strs)[encoding] 来获取该文件或页面的编码方式 或直接抓取页面的charset = xxxx 来获取 2. 遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理. strs
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:36864
    • 提供者:weixin_38519082
« 12 3 4 5 »