点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 中文网页去重
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
信息检索研究室论文集第一卷
信息检索相关论文 集合一 1. 车万翔 刘挺 秦兵 李生 面向依存分析的搭配抽取方法研究 1 全国第六届计算语言学联合学术会议, 2001, 7 Collocation Extraction Oriented to Dependency Parsing 2. 秦兵 郑实福 刘挺 张刚 李生 基于改进的贝叶斯模型的中文网页分类器 8 全国第六届计算语言学联合学术会议, 2001, 7 An Improved Bayes Classifier for Chinese Web Pages 3. 张刚
所属分类:
Web开发
发布日期:2009-08-04
文件大小:1048576
提供者:
chenls
smarty中文手册
Smarty是一个php模板引擎. 更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法 可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人. 例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现.在Smarty的程序里,这些被忽略了.模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等) 有一天程序员想要改变文章检索的
所属分类:
PHP
发布日期:2009-08-13
文件大小:1048576
提供者:
alrmh
smarty中文手册.chm
Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等)。有一天程序员想要改变文章检索的方式
所属分类:
Web开发
发布日期:2009-08-27
文件大小:366592
提供者:
akrick
基于特征串的大规模中文网页快速去重算法研究
这是一篇讲述通过特征串来对中文网页进行快速的地去重。希望有人用的到!
所属分类:
其它
发布日期:2009-09-11
文件大小:340992
提供者:
zhangxin3053602
smarty中文手册
Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等)。有一天程序员想要改变文章检索的方式
所属分类:
PHP
发布日期:2009-11-02
文件大小:353280
提供者:
olaile
asp.net 网页搜索功能
多线程网络蜘蛛 网页定向采集 多语言网页编码自动识别 哈希表网页去重 智能网页正文抽取 基于词库的智能中文分词 中文分词词库管理 海量数据毫秒级全文检索 缓存技术 网页快照 高级搜索 竞价排名
所属分类:
C#
发布日期:2010-10-29
文件大小:2097152
提供者:
scsuns520
K风网页搜索系统(.NET) v2.2 源码
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; V2.1版本主要改
所属分类:
C#
发布日期:2010-10-31
文件大小:2097152
提供者:
yuanhongcs
c#多线程抓取网页内容
在《爬虫/蜘蛛程序的制作(C#语言)》一文中,已经介绍了爬虫程序实现的基本方法,可以说,已经实现了爬虫的功能。只是它存在一个效率问题,下载速度可能很慢。这是两方面的原因造成的: 1. 分析和下载不能同步进行。在《爬虫/蜘蛛程序的制作(C#语言)》中已经介绍了爬虫程序的两个步骤:分析和下载。在单线程的程序中,两者是无法同时进行的。也就是说,分析时会造成网络空闲,分析的时间越长,下载的效率越低。反之也是一样,下载时无法同时进行分析,只有停下下载后才能进行下一步的分析。问题浮出水面,我想大家都会想到
所属分类:
C#
发布日期:2010-12-18
文件大小:6144
提供者:
mfr625
smarty 中文 chm 手册
Smarty - PHP 模板编译引擎 Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等
所属分类:
Web开发
发布日期:2012-04-16
文件大小:366592
提供者:
simi8271
Lucene4.6+Solr4.6实战开发垂直搜索引擎视频课程
课程目录: 00.说在前面的话 01.heritrix环境搭建 02.如何进行主题抓取 03.heritrix优化 04.解析html网页 05.中文分词(1) 06.中文分词(2) 07.中文分词(3) 08.中文分词(4) 09.中文分词(5) 10.中文分词(6) 11.中文分词(7) 12.中文分词(8) 13.网页去重(1) 14.网页去重(2) 15.网页去重(3) 16.网页去重(4) 17.lucene4.6快速搭建 18.lucene4.6索引的相关操作 19.lucene4
所属分类:
Java
发布日期:2016-01-15
文件大小:2048
提供者:
unmbnw
smarty 中文手册
php smarty中文 手册 Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等)。有
所属分类:
PHP
发布日期:2008-12-09
文件大小:370688
提供者:
robinho_nju
smarty中文手册
Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等)。有一天程序员想要改变文章检索的方式
所属分类:
Web开发
发布日期:2009-02-19
文件大小:366592
提供者:
ldpldpp
smarty中文手册.chm
Smarty是一个php模板引擎。更准确的说,它分开了逻辑程序和外在的内容,提供了一种易于管理的方法。可以描述为应用程序员和美工扮演了不同的角色,因为在大多数情况下 ,他们不可能是同一个人。例如,你正在创建一个用于浏览新闻的网页,新闻标题,标签栏,作者和内容等都是内容要素,他们并不包含应该怎样去呈现。在Smarty的程序里,这些被忽略了。模板设计者们编辑模板,组合使用html标签和模板标签去格式化这些要素的输出(html表格,背景色,字体大小,样式表,等等)。有一天程序员想要改变文章检索的方式
所属分类:
Web开发
发布日期:2009-02-22
文件大小:366592
提供者:
zcshuo
黑马57期黑马最新资源来咯
黑马57期 视频 下载 黑马57期.jpg 资料目录: 黑马57期 |____27 |____软件测试相搭配的测试工具 |____软件测试教程讲义 |____9.QC管理学习(类禅道)学习 |____8.性能测试LoadRunner |____7.接口视频Jmeter |____6.移动端项目测试视频appium |____5.web自动化测试视频selenium |____4.编程数据结构python6学习教程 |____3.深入了解软件测试基础视频 |____2.Linux和数据库SQL
所属分类:
Java
发布日期:2019-04-28
文件大小:116
提供者:
qq_32718315
K风网页搜索系统 K-PageSearch Engine Version v2.2 sp3.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP2改进:修正检索组件错误引起的
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39840650
K风网页搜索 K-PageSearch v2.2 SP5.rar
K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP5:修正改进搜索算
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39840515
K风网页搜索系统(.NET) v2.2.rar
K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;V2.1版本主要改进
所属分类:
其它
发布日期:2019-07-09
文件大小:2097152
提供者:
weixin_39841882
中文网页重设与排版typo.css.zip
中文网页重设与排版: 目标:一致化浏览器排版效果,构建最适合中文阅读的网页排版。包括桌面和移动平台。 Alpha 中,各路牛人都来支持一下,加入开发啊! 预览:typo.css 一、目录结构 . ├── README.md --- 使用帮助 ├── TODO.md --- TODO-List ├── license.txt --- 许可证 ├── typo.css --- 将应用于你的项目 └── typo.html --- Demo/预览 二、TYPO.CSS 的设计和使用 建议看源代码,特
所属分类:
其它
发布日期:2019-07-18
文件大小:15360
提供者:
weixin_39841848
RFC3261中文.pdf
标准使用SIP的各个视频厂家对协议理解不同,造成不同厂家通信困难,统一协议标准。定义了关于sip的一些标准。atlanta. com .bi⊥。xi.cor PrOXy A1ice′s Bob′s softphone sIP Phone TNV工TEF1 INVITE F2 100 Trying E3 工 NVITE E4 100 Trying F5 1< 180 Ringing F6 180Rng⊥ng 180 Ringing E8 I< 200○KF9 2000KF10 200O
所属分类:
C++
发布日期:2019-09-02
文件大小:1048576
提供者:
qq_34950507
使用Python检测文章抄袭及去重算法原理解析
在互联网出现之前,“抄”很不方便,一是“源”少,而是发布渠道少;而在互联网出现之后,“抄”变得很简单,铺天盖地的“源”源源不断,发布渠道也数不胜数,博客论坛甚至是自建网站,而爬虫还可以让“抄”完全自动化不费劲。这就导致了互联网上的“文章”重复性很高。这里的“文章”只新闻、博客等文字占据绝大部分内容的网页。 中文新闻网站的“转载”(其实就是抄)现象非常严重,这种“转载”几乎是全文照抄,或改下标题,或是改下编辑姓名,或是文字个别字修改。所以,对新闻网页的去重很有必要。 一、去重算法原理 文章去重(
所属分类:
其它
发布日期:2021-01-20
文件大小:496640
提供者:
weixin_38629873
«
1
2
3
»