点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - html提取文本
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
超级批量文本替换 5.02 天涯浪子
文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手, 支持所有纯ANSI文件,支持GBK/Unicode/UTF8编码的htm、html、asp、java、php等文件 可自定义所支持的文件类型 支持16进制替换 支持单行和多行以及段落替换 支持特征替换和提取 支持正则替换 支持多规则同时替换并可以行导入规则,智能规则排序功能, 支持多级目录、大小写匹配、支持备份和恢复,替换速度快。 新版5.0增加了utf8编码的全面识别,优化了替换引擎,替换速度更快,增加了正则替换,所有替换的疑
所属分类:
C#
发布日期:2009-05-29
文件大小:785408
提供者:
sbfivwsll
C++程序读取PDF中的文本
C++程序读取PDF中的文本。Adobe允许你提交PDF文件,提取成文本或HTML后再通过邮件发送给你。但是假如你需要自己提取文本或在程序中加入这个功能的话,需要花费很多时间。也许你还需要对文本应用某些特殊格式(如,添加tab分隔符)以便它们能够导入到Execl中(比如,你需要将PDF文档中包含的表格数据导入到Excel中,这就是编写这段代码的目的)。附件中的程序使用VC6.0编译通过,可以成功的读取PDF文件中的文本。并且保存到一个txt文件中
所属分类:
C++
发布日期:2009-06-14
文件大小:101376
提供者:
songchaofly
文本挖掘 – 信息提取 ppt
Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models).
所属分类:
Web开发
发布日期:2009-07-08
文件大小:650240
提供者:
rockychan1206
超级文本替换器 批量文本替换的不二之选,站长必备
功能说明: 文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手,支持所有纯ANSI文件,支持GBK/Unicode/UTF8编码的htm、html、asp、java、php等文件,可自定义所支持的文件类型,支持16进制替换,支持单行和多行以及段落替换,支持特征替换和提取,支持正则替换,支持多规则同时替换并可以行导入规则,智能规则排序功能,支持多级目录、大小写匹配、支持备份和恢复,替换速度快。 1.完全绿色安装,单独的可执行文件,操作方便 2.段落文字的批量替换(整段文字的替换) 3
所属分类:
C#
发布日期:2009-07-27
文件大小:835584
提供者:
py11520
超级批量文本替换(UltraReplace)
用了很多批量替换软件,这个是最好的,功能强大、替换速度快、耗费资源少,值得一用! 文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手,支持所有纯ansi文件,支持gbk/unicode/utf8编码的 htm、html、asp、java、php等文件,可自定义所支持的文件类型,支持16进制替换,支持单行和多行以及段落替换,支持特征替换和提取,支持正则替换,支持多规则同时替换并可以行导入规则,智能规则排序功能,支持多级目录、大小写匹配、支持备份和恢复,替换速度快。
所属分类:
C#
发布日期:2009-10-17
文件大小:789504
提供者:
siyuanmei
大规模网页模块识别与信息提取系统设计与实现
本科生论文。本文在已有的基于Dom-Tree和启发式规则的网页信息提取算法的基础上,通过为所有符合W3C规范的Html标签分类,逐个分析各Html标签所包含的语义信息,细化规则设置,实现了一种自底向上的无信息遗漏的网页分块算法,并在此基础上,利用统计方法得到详细的概率分布数据,实现了文本相似度比较和Bayes后验概率估计两种网页主题内容信息块识别算法,并将其求交,提高了主题内容信息块的识别精确度。 上述算法已集成到天网搜索引擎平台的网页预处理模块中,并且在SEWM 2008会议中,以这套算法为
所属分类:
其它
发布日期:2009-11-30
文件大小:1048576
提供者:
zjj77520
屏幕颜色提取器小软件
一个很方便简单的屏幕颜色提取器,可提取任意像素点颜色值,转换为文本表示、HTML表示、RGB表示等等。 好好好好好
所属分类:
Web开发
发布日期:2009-12-14
文件大小:139264
提供者:
tju_zhangj
风越批量提取文本工具
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取的文本内容生成TXT文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数)
所属分类:
Web开发
发布日期:2009-12-18
文件大小:9437184
提供者:
liunu
超级批量文本替换软件
文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手,支持所有纯ansi文件,支持gbk/unicode/utf8编码的 htm、html、asp、java、php等文件,可自定义所支持的文件类型,支持16进制替换,支持单行和多行以及段落替换,支持特征替换和提取,支持正则替换,支持多规则同时替换并可以行导入规则,智能规则排序功能,支持多级目录、大小写匹配、支持备份和恢复,替换速度快。
所属分类:
C#
发布日期:2009-12-30
文件大小:791552
提供者:
xytop2009
超级批量文本替换———不二选择
文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手,支持所有纯ansi文件,支持gbk/unicode/utf8编码的 htm、html、asp、java、php等文件,可自定义所支持的文件类型,支持16进制替换,支持单行和多行以及段落替换,支持特征替换和提取,支持正则替换,支持多规则同时替换并可以行导入规则,智能规则排序功能,支持多级目录、大小写匹配、支持备份和恢复,替换速度快。
所属分类:
C#
发布日期:2010-01-04
文件大小:792576
提供者:
gguozhenqian
Html parser
当我们自己开发一些处理网页的应用程序时,会想到要开发一个单独的网页解析器,这一部分的工作必定需要付出相当的精力和时间。事实上,做为 JAVA 应用程序开发者, HtmlParser 为其提供了强大而灵活易用的开源类库,大大节省了写一个网页解析器的开销。 HtmlParser 是 http://sourceforge.net 上活跃的一个开源项目,它提供了线性和嵌套两种方式来解析网页,主要用于 html 网页的转换(Transformation) 以及网页内容的抽取 (Extraction)。H
所属分类:
Web开发
发布日期:2010-03-15
文件大小:3145728
提供者:
qumilann
风越批量文本提取、网页采集器
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 可设置提取文件的间隔,避免下载网页过快,服务器不响应 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容 提取HT
所属分类:
Web开发
发布日期:2010-11-08
文件大小:10485760
提供者:
liunu
过滤html的标签
用于过滤html的标签,应用java语言,提取html中文本的部分
所属分类:
Java
发布日期:2012-06-11
文件大小:760
提供者:
kongleilei1024
网页文本提取器
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容
所属分类:
其它
发布日期:2012-11-12
文件大小:12582912
提供者:
chuck3561
pdfbox 提取 pdf 中 文字和图片 并 可转 html
pdfbox 提取 pdf 中 文字和图片 并 可转 html 分2个文件,一个专门提取文本,内容可转为html,另一个文件专门用来提取图片,大家可自行整合为一个文件。使用pdfbox最新提取图片的方法。
所属分类:
Java
发布日期:2016-01-27
文件大小:3072
提供者:
geistseele
html转纯文本 工具
得到一篇html源代码,复制下来,点击该工具左上角图标->编辑->粘贴,然后回车,输入Ctrl+Z(屏幕上会显示^Z),再回车,输入Ctrl+Z,然后再回车,这时就会把html源代码中的有用信息,以纯文本的形式提取出来,复制拿去用吧。
所属分类:
WindowsPhone
发布日期:2016-07-06
文件大小:196608
提供者:
yws_swy
Python使用get_text()方法从大段html中提取文本的实例
今天小编就为大家分享一篇Python使用get_text()方法从大段html中提取文本的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
所属分类:
其它
发布日期:2020-09-18
文件大小:89088
提供者:
weixin_38610870
Java正则表达式提取html纯文本
做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题。现将我做的正则匹配贴上: import java.util.regex.Matcher; import java.util.regex.Pattern; public class TestReg { static String reg = "([sS]*?)"; public static void main(String[] args) { // TODO Auto-generated method stub St
所属分类:
其它
发布日期:2020-12-22
文件大小:43008
提供者:
weixin_38650508
Python使用get_text()方法从大段html中提取文本的实例
如下所示: </
所属分类:
其它
发布日期:2020-12-31
文件大小:93184
提供者:
weixin_38679651
TextExtraction:从各种格式的文件中提取文本-源码
文字提取 介绍: 从各种格式的文件中提取文本。 格式: Microsoft Office-Word,Excel和PowerPoint 旧版本(97-03); 新版本; 宏文件。 纯文本文件文本 富文本格式(RTF) 便携式文件格式(PDF) 文件类型; 扫描类型(使用OCR) 类似于Excel的格式CSV和tsv 开放文件格式(ODF) ods; odt; odp 标记语言格式Markdown(md); Yaml(yml); HTML(html,htm); xml; chm; 乳胶
所属分类:
其它
发布日期:2021-02-17
文件大小:1018880
提供者:
weixin_42107374
«
1
2
3
4
5
6
7
8
9
10
...
20
»