点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 抓去网页
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
小偷程序(模拟请求,抓取网页内容)
很多朋友多问过我如何抓取网页的内容,其实并不难,但是对于网页的分析却不是很简单,以前我接触正则表达式比较少,就自己去分析页面,结果是要么抓到的数据不准,要么就根本抓不到。 现在写了两个类给朋友们用,使用正则表达式分析网页的,效率还算可以吧,暂时我就用到这几个功能,如果朋友们有什么好的想法可以联系我,共同把这个API强大起来。 例子就不写了,里面有帮助文档和正则表达式测试工具,自己看看吧。 提供三个下载地址: http://www.xiaojingdou.com/Thief.rar http:/
所属分类:
Java
发布日期:2009-06-28
文件大小:45056
提供者:
suolong123
红蜻蜓抓图2.08 build 20100101
红蜻蜓抓图精灵(RdfSnap)是一款完全免费的专业级屏幕捕捉软件,能够让您得心应手地捕捉到需要的屏幕截图。捕捉图像方式灵活,主要可以捕捉整个屏幕、活动窗口、选定区域、固定区域、选定控件、选定菜单、选定网页等,图像输出方式多样,主要包括文件、剪贴板、画图和打印机。软件具有捕捉历史、捕捉光标、设置捕捉前延时、显示屏幕放大镜、自定义捕捉热键、图像文件自动按时间或模板命名、捕捉成功声音提示、重复最后捕捉、预览捕捉图片、图像打印、图像裁切、图像去色、图像反色、图像翻转、图像旋转、图像大小设置、常用图片
所属分类:
其它
发布日期:2010-01-26
文件大小:2097152
提供者:
panurl
红蜻蜓抓图精灵2.05
红蜻蜓抓图精灵(RdfSnap)是一款完全免费的专业级屏幕捕捉软件,能够让您得心应手地捕捉到需要的屏幕截图。捕捉图像方式灵活,主要可以捕捉整个屏幕、活动窗口、选定区域、固定区域、选定控件、选定菜单、选定网页等,图像输出方式多样,主要包括文件、剪贴板、画图和打印机。软件具有捕捉历史、捕捉光标、设置捕捉前延时、显示屏幕放大镜、自定义捕捉热键、图像文件自动按时间或模板命名、捕捉成功声音提示、重复最后捕捉、预览捕捉图片、图像打印、图像裁切、图像去色、图像反色、图像翻转、图像旋转、图像大小设置、常用图片
所属分类:
其它
发布日期:2010-04-30
文件大小:2097152
提供者:
panyue208
htmlparser实现从网页上抓取数据 代码例子
很好的htmlparser例子 1.htmlparser 使用 2. 使用HtmlParser抓去网页内容 3.将整个html内容保存到指定文件 4利用htmlparser提取网页纯文本的例子 5.html解析table 6.html解析常用 7.使用 HttpClient 和 HtmlParser 实现简易爬虫 8.htmlparser汇总说明 等
所属分类:
Web开发
发布日期:2010-06-23
文件大小:226304
提供者:
kun5891504
使用socket抓取网页源码
本人前面已经写了一个抓取网页的程序,准确性很高,但是没有蜘蛛的爬行功能,而且效率也不是怎么很理想;本人经过一段时间的研究,参考了其他高手的程序,然后自己写了一个网页抓取的,具有蜘蛛爬行功能,大家有兴趣可以去学习一下
所属分类:
Web开发
发布日期:2010-11-05
文件大小:368640
提供者:
zengxin2008
c#多线程抓取网页内容
在《爬虫/蜘蛛程序的制作(C#语言)》一文中,已经介绍了爬虫程序实现的基本方法,可以说,已经实现了爬虫的功能。只是它存在一个效率问题,下载速度可能很慢。这是两方面的原因造成的: 1. 分析和下载不能同步进行。在《爬虫/蜘蛛程序的制作(C#语言)》中已经介绍了爬虫程序的两个步骤:分析和下载。在单线程的程序中,两者是无法同时进行的。也就是说,分析时会造成网络空闲,分析的时间越长,下载的效率越低。反之也是一样,下载时无法同时进行分析,只有停下下载后才能进行下一步的分析。问题浮出水面,我想大家都会想到
所属分类:
C#
发布日期:2010-12-18
文件大小:6144
提供者:
mfr625
htmlparse 解析html网页
抓去网页数据时使用,根据网页的结果抓取网页上的数据!
所属分类:
Java
发布日期:2012-07-30
文件大小:2097152
提供者:
hfmbook
网页源码信息提取分析测试工具
抓取网页信息时需要用正则表达式去分析,这个工具就是分析测试正则表达式抓取信息的工具。 前段时间做了抓取58同城信息的小程序,于是做了这个工具。 左上角输入正则字符串 左下角输入网页的源码。点GO开始提取,提取的结果会显示的右边
所属分类:
C#
发布日期:2013-04-22
文件大小:41984
提供者:
aley
ExcelVBA查询LOL战斗力
利用EXCEL的VBA "xmlHttp"连接 LOL盒子战斗力网页 解析地址语法 并且获得网页源码 应用简单的split函数进行解析 抓去特定的网页信息 为VB6.0/VBA开发 提供了一个简单的实例~ 实例中 需要UTF-8转码。
所属分类:
VB
发布日期:2014-07-28
文件大小:44032
提供者:
qq_16198651
csharp仿爬虫抓取网页内容
csharp仿爬虫抓取网页内容,本项目以抓取招聘网站公司内容为例,里面的去内容的正则表达式需要定期更新,否则抓不到;里面还有每天检测是否能抓到,抓不到则说明网站有更新,需要修改
所属分类:
系统集成
发布日期:2015-04-02
文件大小:4194304
提供者:
huwei2003
蜘蛛抓取网页数据
是一个开放源码网页数据抓取工具,比如网上有很多数据不想手动去记录,可以借助此工具,更改想抓取的网址及规则,获取想要的数据。
所属分类:
C#
发布日期:2015-06-16
文件大小:1048576
提供者:
gaolegaowudi
网页FLASH动画抓取器去广告版
网页FLASH动画抓取器作者发现目前绝大多数的网站都是仅提供FLASH播放,而不能下载,对于一些能自已喜爱的精美FLASH歌曲或游戏来说都是无法做到保存,所以编写了这个软件。网页FALSH抓取器可以轻松的抓取网页中的FLASH,只要有一个FLASH曾在IE浏览器中播放过,它就能保存下来,并且具有FLASH收藏管理功能,同时还是一个非常小巧的FLASH播放器。 网页FLASH动画抓取器 操作说明: 1.首先进入FLASH动画网站,播放您喜欢的FLASH。 2.点“搜索”按钮,您刚才播放过的FLA
所属分类:
网络监控
发布日期:2015-09-02
文件大小:463872
提供者:
zpdiy08
抓取的程序
适合用去抓取网页的抓取程序
所属分类:
专业指导
发布日期:2007-06-28
文件大小:629760
提供者:
cdjlion
将网页上的图片保存在本地
通过输入的网络图片地址来抓取网页。 首先获取图片地址,然后根据图片地址请求网页获取流转成图片保存到本地。 可以改为爬去百度图片或抓取网页验证码
所属分类:
C#
发布日期:2019-03-22
文件大小:174080
提供者:
q944468002
基于iframe实现ajax跨域请求 获取网页中ajax数据
主要介绍了基于ifr a me实现ajax跨域请求,并获取网页中ajax数据,如何利用网页ajax请求暴露出来的接口去抓取网页数据?需要的朋友可以参考下
所属分类:
其它
发布日期:2020-10-22
文件大小:64512
提供者:
weixin_38531788
正则方式的自动小偷抓网程序
公司里面有许多数据没人去录入,做一个抓取网页的程序,以前做CMS系统的时候涉及过,不过这次的处理HTML上和以前做了些区别
所属分类:
其它
发布日期:2020-10-28
文件大小:45056
提供者:
weixin_38538585
Python实现多线程抓取网页功能实例详解
本文实例讲述了Python实现多线程抓取网页功能。分享给大家供大家参考,具体如下: 最近,一直在做网络爬虫相关的东西。 看了一下开源C++写的larbin爬虫,仔细阅读了里面的设计思想和一些关键技术的实现。 1、larbin的URL去重用的很高效的bloom filter算法; 2、DNS处理,使用的adns异步的开源组件; 3、对于url队列的处理,则是用部分缓存到内存,部分写入文件的策略。 4、larbin对文件的相关操作做了很多工作 5、在larbin里有连接池,通过创建套接字,向目标站点
所属分类:
其它
发布日期:2020-12-24
文件大小:96256
提供者:
weixin_38635449
node.js基础模块http、网页分析工具cherrio实现爬虫
一、前言 说是爬虫初探,其实并没有用到爬虫相关第三方类库,主要用了node.js基础模块http、网页分析工具cherrio。 使用http直接获取url路径对应网页资源,然后使用cherrio分析。 这里我主要学习过的案例自己敲了一遍,加深理解。在coding的过程中,我第一次把jq获取后的对象直接用forEach遍历,直接报错,是因为jq没有对应的这个方法,只有js数组可以调用。 二、知识点 ①:superagent抓去网页工具。我暂时未用到。 ②:cherrio
所属分类:
其它
发布日期:2020-12-23
文件大小:71680
提供者:
weixin_38501916
用python抓取网页的图片
python抓取数据 想要做数据分析师就要知道如何将网页上的数据获取。 比如我要去获取http://pic.netbian.com/4kdongman/index_2.html这个网页里所有的图片。 首先电脑里应该先有安装python和配置好python的环境变量。 然后我要先建一个文件夹,用来存我抓取到的图片,这个文件夹要建在和我要写python代码的py文件同一个目录里。 原创文章 4获赞 15访问量 2022
所属分类:
其它
发布日期:2020-12-20
文件大小:56320
提供者:
weixin_38609693
Python爬虫框架Scrapy实战之批量抓取招聘信息
网络爬虫抓取特定网站网页的html数据,但是一个网站有上千上万条数据,我们不可能知道网站网页的url地址,所以,要有个技巧去抓取网站的所有html页面。Scrapy是纯Python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便~ Scrapy 使用wisted这个异步网络库来处理网络通讯,架构清晰,并且包含了各种中间件接口,可以灵活的完成各种需求。整体架构如下图所示: 绿线是数据流向,首先从初始URL 开始,Sched
所属分类:
其它
发布日期:2021-01-21
文件大小:149504
提供者:
weixin_38689113
«
1
2
3
4
5
6
7
8
9
10
»