点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 网页正文分析
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
SOPI垂直搜索引擎系统 V2.2
SOPI垂直搜索引擎2.0是一个从信息采集到分析到索引的整套解决方案,让你也可以轻松拥有一个多功能垂直搜索引擎。可以针用于行业垂直信息进行搜索,网站搜索等各类应用。 SOPI垂直搜索引擎系统的应用特点 外网搜索引擎:众多内容型网站为了保持数据的最新,不得不花费大量的人力进行内容更新。 SOPI 系统可以锁定需要的网站,进行定时采集此网站的最新内容;可以节省大量的人力成本,而且可以保证信息的全面性,同时结合搜索技术在海量的信息库中快速找到需要的信息。 高应用扩展性,可以根据用户需求快速配置成为不
所属分类:
Web开发
发布日期:2010-05-09
文件大小:2097152
提供者:
ntsanxin
LJParser文本搜索与挖掘开发平台
一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
所属分类:
Web开发
发布日期:2010-05-11
文件大小:17825792
提供者:
lingjoin
J2EE学习笔记(J2ee初学者必备手册)
内容目录 .......................1 Java/JavaEE.....1 2008年11月1日...............1 Unix 学习笔记7 一、Unix前言............7 二、Unix基础知识....7 三、Unix常用命令....8 四、 文件系统权限.21 五、软硬连接的区别..........................22 六、范例程序...........22 七、网络基本命令...26 八、Shell scr ipts:脚本编程...
所属分类:
Java
发布日期:2010-05-27
文件大小:1048576
提供者:
byl0516
J2EE学习笔记(J2ee初学者必备手册)
内容目录 .......................1 Java/JavaEE.....1 2008年11月1日...............1 Unix 学习笔记7 一、Unix前言............7 二、Unix基础知识....7 三、Unix常用命令....8 四、 文件系统权限.21 五、软硬连接的区别..........................22 六、范例程序...........22 七、网络基本命令...26 八、Shell scr ipts:脚本编程...
所属分类:
Java
发布日期:2010-05-27
文件大小:1048576
提供者:
yangshanyin
美加新闻聚合系统3.0
5大全自动技术——支持模板定制。你所要做的就是找到信息源,添加到后台即可。 自动识别语种:支持英语、日语、俄语、法语等多种语言的自动识别。 自动识别编码:支持ANSI、EUC_JP、UTF-8、Big5等多种字符集编码的自动识别。 自动抽取新闻:无需分析来源的网页编写特点,支持自动分析来源网页,自动抽取新闻正文。 自动翻译:全自动将外文翻译成中文,从而实现与原文不同,具有原创性。 自动后台更新:全自动后台刷新信息源,不影响访问速度,提供用户感受。 任意模板定制:支持模板的任意定制,可以修改布局
所属分类:
PHP
发布日期:2010-06-13
文件大小:471040
提供者:
eliteschool
美加新闻聚合系统(经典版)
程序简介: 美加新闻聚合系统——支持自动聚合全球各种语言的RSS信息源,经过5大全自动技术,生成原创内容并实时发布。可以自由扩展信息源,定制模板,完全免费的网站建站软件。 选择正确建站软件——从此就像技术型的网站,不再担心自己网站缺乏内容一样。 很多站长建站都向sina学习,希望通过大量的内容来吸引流量。其实这样通过内容建设来建站,就是太辛苦。到哪里去弄那么多原创内容去?看到网络上四处可见的征求原创内容的帖子。我们不禁要感叹,建内容站真是不容易。 还有一种建站方法是建立技术型的网站。例如搜索引
所属分类:
PHP
发布日期:2010-06-21
文件大小:468992
提供者:
eliteschool
搜索引擎-原理、技术与系统
图2-1 搜索引擎示意图................................................................................17 图2-2 搜索引擎三段式工作流程................................................................18 图2-3 搜索引擎的体系结构.........................................................
所属分类:
其它
发布日期:2010-08-25
文件大小:3145728
提供者:
cailiangmu
K风网页搜索系统(.NET) v2.2 源码
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; V2.1版本主要改
所属分类:
C#
发布日期:2010-10-31
文件大小:2097152
提供者:
yuanhongcs
灵柩软件 可用于汉语分词处理
LJParser文本搜索与挖掘开发平台的十大功能: 1. 全文精准检索 支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索,支持AND/OR/NOT以及NEAR邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。 3. 分词标注: 对原始语料进行分词
所属分类:
Web开发
发布日期:2010-11-05
文件大小:688128
提供者:
zhangguoqiang52
论文--网页设计的系统分析
一个简单的规范的网页设计系统分析学年论文,包含目录、正文、参考文献。
所属分类:
网页制作
发布日期:2011-05-30
文件大小:150528
提供者:
xufangfangfafafa
自己动手写网络爬虫
完整版《自己动手写网络爬虫》! 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2
所属分类:
专业指导
发布日期:2013-10-27
文件大小:28311552
提供者:
qq674708957
基于超链接分析的网页正文提取方法
随着网络的迅猛发展, w eb服务已经成为研究的热点之一. 本文介绍了一种文件类型网页文件的文本信息预处理技术. 该方法能够解析网页文件的组成结构, 并从中提取出主体文本以供处理. 测试表明该方法能快速有效地得到大部分HTML网页的主体部分
所属分类:
网络基础
发布日期:2013-11-26
文件大小:1048576
提供者:
np163
龙蛛网页正文分析工具 附源代码
龙蛛根据网页框架自动分析网页正文,发布源代码供大家切磋
所属分类:
C++
发布日期:2008-10-17
文件大小:445440
提供者:
clwgh
基于HTML标记用途分析的网页正文提取技术
基于HTML标记用途分析的网页正文提取技术
所属分类:
其它
发布日期:2015-07-30
文件大小:623616
提供者:
maomaosi2009
K风网页搜索系统 K-PageSearch Engine Version v2.2 sp3.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP2改进:修正检索组件错误引起的
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39840650
K风网页搜索 K-PageSearch v2.2 SP5.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP5:修正改进搜索算
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39840515
K风网页搜索系统(.NET) v2.2.rar
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;V2.1版本主要改进
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39841882
红薯HtmlSucker0.0.1HTML网页信息提取工具包
HtmlSucker是一款用来从一个HTML网页中提取文章信息的小工具包,例如从网页中提取文章标题、作者、发布时间、 封面图以及文章正文内容。基于 jsoup 库进行 HTML 解析。 HtmlSucker 提供两种正文提取算法: 最大文本块:分析整个 HTML 文档的所有节点,提取其中包含最多文字的的连续节点。 文本密度算法:参考 WebCollector 项目的代码 目前还处于非常简单
所属分类:
其它
发布日期:2019-07-24
文件大小:14336
提供者:
weixin_39840650
网页正文提取器下载 网页正文提取器 v1.0
网页正文提取工具是一款强大的网页提取软件,该软件通过对比分析搜狐、新浪、腾讯、网易、中国新闻网、百度、21cn网、中华网等大型门户网站,详细的分析其噪音数据的特点,然后
所属分类:
其它
发布日期:2020-11-09
文件大小:472064
提供者:
weixin_38691220
融合多特征的蒙汉网页新闻文本相似度计算
跨语言文本相似度计算是挖掘蒙汉可比语料的基础和关键,其结果直接影响了可比语料的质量。本文通过分析新闻文本特点,提出了一种融合多特征的跨语言新闻文本相似度计算方法。该方法首先抽取新闻的发布日期、标题及正文信息作为特征,再利用双语文档发布日期的差异、正文长度关系、正文阿拉伯数字相似度、标题重合程度及正文重合程度五种启发信息进行加权线性组合来判断相似程度。实验表明,本文提出的方法能明显提高蒙汉新闻文本相似度计算的准确率。
所属分类:
其它
发布日期:2021-03-02
文件大小:676864
提供者:
weixin_38502639
«
1
2
3
»