点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 采集指定网页的内容
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
JSp网络蜘蛛采集程序
一个JSp仿网络蜘蛛爬行程序,可以抓取或是采集指定网页的内容,这是一个可供学习的参考示例,完成了JSP采集的基本原理功能,你可以做为一个参考。
所属分类:
Java
发布日期:2009-08-12
文件大小:2097152
提供者:
jjh371898307
新闻采集 数据采集 本地搜索引擎案例
规则定义:通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 数据保存:数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应 计划任务:通过这个功能可以让你的采集任务定时或者一直循环执行。 网页正文提取:可以将正文从网页htm代码中提取出来并进行适当的格式转换,并自动删除无用的htm代码。 采集结果分类:可以根据用户定义的分类信息进行采集结果的自动分类。 过滤重复内容:自动删除重复内容。 数据发布:可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。
所属分类:
其它
发布日期:2010-04-23
文件大小:365568
提供者:
changyuanaccp
文档批量智能采集器软件
软件功能:可用多任务多线程方式采集任何网页上的任何指定文本内容,并进行你需要的相应过滤和处理,可以用搜索关键词方式采集需要的指定搜索结果..
所属分类:
其它
发布日期:2010-09-24
文件大小:140288
提供者:
zjh19821120
网页数据采集器-支持ACCESS、SQLSERVER、MYSQL数据库
可同时采集任何内容 除了最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等;强大的信息自动再加工能力 你可以在配置任务的时候,指定对采集到的内容进行任何的替换、筛选。 支持实时保存到数据库 支持ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支持更多类型的数据库)。
所属分类:
其它
发布日期:2011-03-03
文件大小:2097152
提供者:
wangyi198788
多线程、高性能采集器爬虫.net版源码,可采ajax页面
1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
所属分类:
C#
发布日期:2011-12-20
文件大小:1048576
提供者:
andylaufzf
采集工具_采集软件_熊猫智能采集助手
熊猫采集软件是新一代采集软件,全程可视化视窗鼠标操作,用户无需关心网页源码,无需编写采集规则,无需使用正则表达式技术,全程智能化辅助,是采集软件行业的换代产品。同时也是通用性采集软件,可以应用在各个行业,满足各种采集需求。是复杂采集需求的必选,也是采集软件使用新手的首先。 熊猫采集软件的设计目标之一,是作为通用的垂直搜索引擎,配合熊猫的分词索引检索引擎,用户可以轻松构建自己的行业垂直搜索引擎,如招聘人才、房产、购物、医疗健康、二手、分类信息、商务、交友、论坛、博客、新闻、经验、知识、软件等等,
所属分类:
互联网
发布日期:2012-03-13
文件大小:2097152
提供者:
diandianuu
简单的网页内容采集器
预览图片见:http://www.cnblogs.com/xxpyeippx/archive/2008/03/31/1131211.html运行环境windows nt/xp/2003 or above.net Framework 1.1SqlServer 2000 开发环境 VS 2003目的学习了网络编程,总要做点什么东西才好。于是想到要做一个网页内容采集器。作者主页: http://www.fltek.com.cn使用方式测试数据采用自cnBlog。见下图用户首先填写“起始网页”,即从哪
所属分类:
C#
发布日期:2012-04-09
文件大小:52224
提供者:
jonny_jun_gao
多线程、高性能采集器爬虫.net版源码
1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
所属分类:
C#
发布日期:2012-08-27
文件大小:1048576
提供者:
dream_boy
新闻采集 数据采集 本地搜索引擎案例
规则定义:通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 数据保存:数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应 计划任务:通过这个功能可以让你的采集任务定时或者一直循环执行。 网页正文提取:可以将正文从网页htm代码中提取出来并进行适当的格式转换,并自动删除无用的htm代码。 采集结果分类:可以根据用户定义的分类信息进行采集结果的自动分类。 过滤重复内容:自动删除重复内容。 数据发布:可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。
所属分类:
其它
发布日期:2012-11-06
文件大小:365568
提供者:
anjun97
JSp网络蜘蛛采集程序
内容索引:JSP源码,其它类别,JSP采集程序 一个JSp仿网络蜘蛛爬行程序,可以抓取或是采集指定网页的内容,这是一个可供学习的参考示例,完成了JSP采集的基本原理功能,你可以做为一个参考。
所属分类:
Web开发
发布日期:2012-11-28
文件大小:2097152
提供者:
frank1061226
AMR采集系统(原万用小偷程序) v3.1
AMR采集系统(原万用小偷)是一个帮助广大草根站长快速丰富网站内容,以提高网站流量的web应用程序。 AMR自动采集系统(原万用小偷程序)是一款全自动采集网站的web应用程序,目前支持95%以上的网站采集。 相对于市面上其他小偷程序或采集工具,本程序具有如下特点: 1. 安装方便、使用简单:只需输入想要采集的目标站网址信息,即可将目标站内容自动采集过来;通过配置替换规则,修改CSS即可定制化网站布局和内容; 2. 支持静态生成、并按需更新静态:只有用户(包括搜索引擎)访问的页面才会被采集,并且
所属分类:
C#
发布日期:2013-01-10
文件大小:1048576
提供者:
harry125
多线程、高性能采集器爬虫.net版源码,可采ajax页面
1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
所属分类:
C#
发布日期:2013-06-23
文件大小:1048576
提供者:
wxlong8888168
多线程、高性能采集器爬虫.net版源码,可采ajax页面
1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
所属分类:
C#
发布日期:2014-07-02
文件大小:1048576
提供者:
hamjolley1234
多线程、高性能采集器爬虫.net版源码,可采ajax页面
1、数据采集基本功能 1)支持多任务、多线程数据采集,同时支持一个采集任务多个 多线程、高性能采集器爬虫.net版源码,可采ajax页面 实例运行,即将采集任务规则与采集任务运行进行剥离,方便采集任务的配置、跟踪管理; 2)支持GET、POST请求方式,支持cookie,可满足需身份认真的数据采集,cookie可预先存储,也可实时获取; 3)支持用户自定义的HTTP Header,通过此功能用户可完全模拟浏览器的请求操作,可满足所有的网页请求要求,此功能在数据web发布时尤为有用; 4)采集网
所属分类:
Web开发
发布日期:2015-03-02
文件大小:1048576
提供者:
tytok
JSp网络采集程序.rar
JSp网络采集程序,可以抓取或是采集指定网页的内容,完成了JSP采集的基本原理功能。
所属分类:
其它
发布日期:2019-07-10
文件大小:2097152
提供者:
weixin_39840924
VC 抓取指定网页的源代码.rar
VC 抓取指定网页的源代码,抓取远程指定URL地址中包括的文件,并显示出网页源代码,实现了类似“采集”的功能,将远程网页的内容先读取出来,然后显示,由此可扩展成一个采集模块,添加过滤功能即可,要用到字符串处理相关编程技巧,本程序只是一个远程读取文件的雏形,仅供参考。相关代码片段: //让控件和对应的变量之间进行数据交换,现在将控件数据传给对应变量 UpdateData(true); //m_SiteInfo为控件ID_EDIT_CONTENT读应的变量 m_SiteInfo="
所属分类:
其它
发布日期:2019-07-10
文件大小:19456
提供者:
weixin_39841848
小蚂蚁网页采集伪原创工具 v2.0.zip
小蚂蚁网页采集伪原创工具是一套智能采集和伪原创系统,关键词采集,相比火车头采集,不用写复杂的采集规则!其能根据指定的关键词全自动采集内容和伪原创,自动添加锚文本。 小蚂蚁网页采集伪原创工具不仅将站长从复制采集中解脱出来,更能有效增加网站收录和搜索引擎流量,是建站赚钱的必备工具,本软件可以作为一些*软件的辅助工具,也可以把采集的内容手动发布到你的网站! 小蚂蚁网页采集伪原创工具 v2.0更新: 1,修复了同时只能采集一个关键词的BUG! 2增加UBB链接,TXT格式功能。
所属分类:
其它
发布日期:2019-07-15
文件大小:640000
提供者:
weixin_39840387
PHP 采集获取指定网址的内容
用php来获取指定网页内容的实现代码,一般采集程序经常用的一些代码,这里只是一个简单的基础。更详细的资料可以参考php 采集成品,可以使用的源码,这样才能学会更多的东西。
所属分类:
其它
发布日期:2020-10-29
文件大小:34816
提供者:
weixin_38632006
python使用自定义user-agent抓取网页的方法
本文实例讲述了python使用自定义user-agent抓取网页的方法。分享给大家供大家参考。具体如下: 下面python代码通过urllib2抓取指定的url的内容,并且使用自定义的user-agent,可防止网站屏蔽采集器 import urllib2 req = urllib2.Request('http://192.168.1.2/') req.add_header('User-agent', 'Mozilla 5.10') res = urllib2.urlopen(req) htm
所属分类:
其它
发布日期:2020-12-24
文件大小:28672
提供者:
weixin_38638799
python 采集中文乱码问题的完美解决方法
近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录 1. 在正常情况下..可以用 import chardet thischarset = chardet.detect(strs)[encoding] 来获取该文件或页面的编码方式 或直接抓取页面的charset = xxxx 来获取 2. 遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理. strs
所属分类:
其它
发布日期:2021-01-20
文件大小:36864
提供者:
weixin_38519082
«
1
2
3
4
5
»