点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 抓取页面内容
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
小偷程序(模拟请求,抓取网页内容)
很多朋友多问过我如何抓取网页的内容,其实并不难,但是对于网页的分析却不是很简单,以前我接触正则表达式比较少,就自己去分析页面,结果是要么抓到的数据不准,要么就根本抓不到。 现在写了两个类给朋友们用,使用正则表达式分析网页的,效率还算可以吧,暂时我就用到这几个功能,如果朋友们有什么好的想法可以联系我,共同把这个API强大起来。 例子就不写了,里面有帮助文档和正则表达式测试工具,自己看看吧。 提供三个下载地址: http://www.xiaojingdou.com/Thief.rar http:/
所属分类:
Java
发布日期:2009-06-28
文件大小:45056
提供者:
suolong123
java抓取网页内容--生成静态页面
这个程序利用java抓取网页内容,然后生成生成静态页面
所属分类:
Java
发布日期:2010-01-11
文件大小:23552
提供者:
apiaopiao66
蜘蛛程序,google抓取,简单
蜘蛛,google,百度,抓取,搜索,搜索引擎。免费的,方便好用,能快速抓取页面,可以设置抓取内容,包括URL,新闻,多媒体,图片等信息
所属分类:
其它
发布日期:2010-03-27
文件大小:1048576
提供者:
cqxuqiang023
ASP.NET网页抓取功能
项目结构说明: \ ……\App_Data 项目数据库文件 (ACCESS2003) ……\bin\ …………\AjaxPro.2.dll .NET调用AJAX类库 …………\App_Code.dll 功能类文件 …………\App_Web_ka4newz2.dll *.aspx.cs文件打包 ……\JS\ …………\jquery-1.4.4.min.js JQuery库 …………\scr ipt 系统自定义JS文件 ……\Default.aspx 系统功能页面 ……\Help.txt 帮助文档
所属分类:
Web开发
发布日期:2010-12-24
文件大小:168960
提供者:
yashiralovesandy
ASP.NET 网页抓取WEB版
2010/12/30 v1.2版 改掉程序中所有的select标签 项目结构说明: \ ……\App_Data 项目数据库文件 (ACCESS2003) ……\bin\ …………\AjaxPro.2.dll .NET调用AJAX类库 …………\App_Code.dll 功能类文件 …………\App_Web_ka4newz2.dll *.aspx.cs文件打包 ……\JS\ …………\jquery-1.4.4.min.js JQuery库 …………\scr ipt 系统自定义JS文件 ……\De
所属分类:
Web开发
发布日期:2010-12-30
文件大小:171008
提供者:
yashiralovesandy
抓取页面内容
抓取网页内容,网页新闻 自己稍作修改可抓取有规律命名的图片等等
所属分类:
Java
发布日期:2012-10-22
文件大小:9216
提供者:
lu476036355
最新的抓取页面内容的实例
主要是用来抓取页面的内容的,简单方便使用
所属分类:
C#
发布日期:2012-12-20
文件大小:10240
提供者:
star199006
网站抓取精灵 网站抓取工具
网站图片抓取精灵[1],在它的帮助下你能够完整下载网站的内容,你下载到本地硬盘中的网站内容将仍保持原本的 HTML 格式,其文件名与目录结构都不会变化,这样可以准确地提供网站的镜像。 1、一键保存页面文字 2、下载页面所有图片 3、保存页面所有css 4、保存页面js文件 5、下载单页所有相关文件 6、保存带参数的css和js文件 7、生成单个页面index.html
所属分类:
网管软件
发布日期:2013-07-20
文件大小:601088
提供者:
u011463447
C#页面抓取
本人刚刚完成一个模拟浏览器功能,C#抓取页面内容详解为大家分享
所属分类:
C#
发布日期:2013-12-30
文件大小:313344
提供者:
susan98203751
使用java-jsoup解析html页面内容,爬取想要的信息(如号段)
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。 jsoup 可以从包括字符串、URL 地址以及本地文件来加载 HTML 文档,并生成 Document 对象实例。 如:我们可以通过访问号段查询页面,获取到手机号段信息,并提取信息存储供自身的业务使用。 附件提供了详细的介绍,并通过http get请求方式抓取页面内容的java代码以
所属分类:
Java
发布日期:2014-03-04
文件大小:272384
提供者:
wutian5200
nodejs爬虫抓取页面内容
nodejs爬虫抓取页面内容,简单好用
所属分类:
Javascript
发布日期:2018-09-29
文件大小:941
提供者:
qq_30982915
PHP怎样用正则抓取页面中的网址
从页面中抓取页面中所有的链接,当然使用PHP正则表达式是最方便的办法。要写出正则表达式,就要先总结出模式,那么页面中的链接会有几种形式呢?下面一起来看看。
所属分类:
其它
发布日期:2020-10-21
文件大小:61440
提供者:
weixin_38674616
PHP CURL模拟登录新浪微博抓取页面内容 基于EaglePHP框架开发
PHP CURL模拟登录新浪微博抓取页面内容 基于EaglePHP框架开发,需要的朋友可以参考下。
所属分类:
其它
发布日期:2020-10-28
文件大小:26624
提供者:
weixin_38743602
如何让搜索引擎抓取AJAX内容解决方案
越来越多的网站,开始采用”单页面结构”(Single-page application)。 整个网站只有一张网页,采用Ajax技术,根据用户的输入,加载不同的内容。 这种做法的好处是用户体验好、节省流量,缺点是AJAX内容无法被搜索引擎抓取。举例来说,你有一个网站。 http://example.com 用户通过井号结构的URL,看到不同的内容。 http://example.com#1 http://example.com#2 http://example.com#3
所属分类:
其它
发布日期:2020-12-18
文件大小:73728
提供者:
weixin_38522214
php抓取页面与代码解析 推荐
得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来。下面先简单说一下本文的主要内容: 一、 PHP抓取页面的主要方法: 1. file()函数 2. file_get_contents()函数 3. fopen()->fread()->fclose()模式 4.curl方式 5. fsockopen()函数 socket模式 6. 使用插件(如:http://sourceforge.net/projects/snoopy/) 二、PHP解析h
所属分类:
其它
发布日期:2020-12-17
文件大小:64512
提供者:
weixin_38663608
Mimo-Crawler:使用Firefox和js注入与网页进行交互并抓取其内容的Web抓取工具,以nodejs编写-源码
Mimo Crawler Mimo是一种“最先进的”网络爬虫,它使用无头Firefox和js注入来爬网网页。 为什么选择Mimo? Mimo之所以与众不同,是因为它使用websockets作为非无头浏览器和客户端之间的通信通道,而不是使用DevTools协议和无头模式的浏览器。 您可以通过将javascr ipt代码评估到页面的上下文中来交互和爬网该页面。 这边走: 实现了极高的爬行速度 防火墙的可追溯性降低 可以绕过无头浏览器检测器 产品特点 简单客户端API 互动式抓取 与同类工具
所属分类:
其它
发布日期:2021-02-05
文件大小:766976
提供者:
weixin_42133918
python抓取网页内容并进行语音播报的方法
python2.7,下面是跑在window上的,稍作修改就可以跑在linux上。 实测win7和raspbian均可,且raspbian可以直接调用omxplayer命令进行播放。 利用百度的语音合成api进行语音播报,抓取的页面是北大未名BBS的十大。 先放抓取模块BDWM.py的代码: # -*- coding: utf-8 -*- import urllib2 import HTMLParser class MyParser(HTMLParser.HTMLParser): def __
所属分类:
其它
发布日期:2021-01-20
文件大小:74752
提供者:
weixin_38677806
php抓取页面的几种方法详解
在 做一些天气预报或者RSS订阅的程序时,往往需要抓取非本地文件,一般情况下都是利用php模拟浏览器的访问,通过http请求访问url地址, 然后得到html源代码或者xml数据,得到数据我们不能直接输出,往往需要对内容进行提取,然后再进行格式化,以更加友好的方式显现出来。下面简单说一下php抓取页面的几种方法及原理:一、 PHP抓取页面的主要方法:1. file()函数 2. file_get_contents()函数 3. fopen()->fread()->fclose
所属分类:
其它
发布日期:2021-01-20
文件大小:55296
提供者:
weixin_38640168
深入file_get_contents函数抓取内容失败的原因分析
用file_get_contents来抓取页面内容不成功,可能是因为有些主机服务商把php的allow_url_fopen选项是关闭了,就是没法直接使用file_get_contents来获取远程web页面的内容。那就是可以使用另外一个函数curl。下面是file_get_contents和curl两个函数同样功能的不同写法file_get_contents函数的使用示例:复制代码 代码如下:换成curl函数的使用示例:复
所属分类:
其它
发布日期:2021-01-20
文件大小:34816
提供者:
weixin_38678550
PHP CURL模拟登录新浪微博抓取页面内容 基于EaglePHP框架开发
复制代码 代码如下: /** * CURL请求 * param String $url 请求地址 * param Array $data 请求数据 */ function curlRequest($url,$data=”,$cookieFile=”){ $ch = curl_init(); $option = array( CURLOPT_URL => $url, CURLOPT_HEADER =>0, CURLOPT_RETURNTRANSFER => 1, ); if($c
所属分类:
其它
发布日期:2021-01-20
文件大小:35840
提供者:
weixin_38686399
«
1
2
3
4
5
6
7
8
9
10
...
27
»