您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SOPI垂直搜索引擎系统 V2.2

  2. SOPI垂直搜索引擎2.0是一个从信息采集到分析到索引的整套解决方案,让你也可以轻松拥有一个多功能垂直搜索引擎。可以针用于行业垂直信息进行搜索,网站搜索等各类应用。 SOPI垂直搜索引擎系统的应用特点 外网搜索引擎:众多内容型网站为了保持数据的最新,不得不花费大量的人力进行内容更新。 SOPI 系统可以锁定需要的网站,进行定时采集此网站的最新内容;可以节省大量的人力成本,而且可以保证信息的全面性,同时结合搜索技术在海量的信息库中快速找到需要的信息。 高应用扩展性,可以根据用户需求快速配置成为不
  3. 所属分类:Web开发

    • 发布日期:2010-05-09
    • 文件大小:2097152
    • 提供者:ntsanxin
  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17825792
    • 提供者:lingjoin
  1. J2EE学习笔记(J2ee初学者必备手册)

  2. 内容目录 .......................1 Java/JavaEE.....1 2008年11月1日...............1 Unix 学习笔记7 一、Unix前言............7 二、Unix基础知识....7 三、Unix常用命令....8 四、 文件系统权限.21 五、软硬连接的区别..........................22 六、范例程序...........22 七、网络基本命令...26 八、Shell scr ipts:脚本编程...
  3. 所属分类:Java

    • 发布日期:2010-05-27
    • 文件大小:1048576
    • 提供者:byl0516
  1. J2EE学习笔记(J2ee初学者必备手册)

  2. 内容目录 .......................1 Java/JavaEE.....1 2008年11月1日...............1 Unix 学习笔记7 一、Unix前言............7 二、Unix基础知识....7 三、Unix常用命令....8 四、 文件系统权限.21 五、软硬连接的区别..........................22 六、范例程序...........22 七、网络基本命令...26 八、Shell scr ipts:脚本编程...
  3. 所属分类:Java

    • 发布日期:2010-05-27
    • 文件大小:1048576
    • 提供者:yangshanyin
  1. 美加新闻聚合系统3.0

  2. 5大全自动技术——支持模板定制。你所要做的就是找到信息源,添加到后台即可。 自动识别语种:支持英语、日语、俄语、法语等多种语言的自动识别。 自动识别编码:支持ANSI、EUC_JP、UTF-8、Big5等多种字符集编码的自动识别。 自动抽取新闻:无需分析来源的网页编写特点,支持自动分析来源网页,自动抽取新闻正文。 自动翻译:全自动将外文翻译成中文,从而实现与原文不同,具有原创性。 自动后台更新:全自动后台刷新信息源,不影响访问速度,提供用户感受。 任意模板定制:支持模板的任意定制,可以修改布局
  3. 所属分类:PHP

    • 发布日期:2010-06-13
    • 文件大小:471040
    • 提供者:eliteschool
  1. 美加新闻聚合系统(经典版)

  2. 程序简介: 美加新闻聚合系统——支持自动聚合全球各种语言的RSS信息源,经过5大全自动技术,生成原创内容并实时发布。可以自由扩展信息源,定制模板,完全免费的网站建站软件。 选择正确建站软件——从此就像技术型的网站,不再担心自己网站缺乏内容一样。 很多站长建站都向sina学习,希望通过大量的内容来吸引流量。其实这样通过内容建设来建站,就是太辛苦。到哪里去弄那么多原创内容去?看到网络上四处可见的征求原创内容的帖子。我们不禁要感叹,建内容站真是不容易。 还有一种建站方法是建立技术型的网站。例如搜索引
  3. 所属分类:PHP

    • 发布日期:2010-06-21
    • 文件大小:468992
    • 提供者:eliteschool
  1. 搜索引擎-原理、技术与系统

  2. 图2-1 搜索引擎示意图................................................................................17 图2-2 搜索引擎三段式工作流程................................................................18 图2-3 搜索引擎的体系结构.........................................................
  3. 所属分类:其它

    • 发布日期:2010-08-25
    • 文件大小:3145728
    • 提供者:cailiangmu
  1. K风网页搜索系统(.NET) v2.2 源码

  2. K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; V2.1版本主要改
  3. 所属分类:C#

    • 发布日期:2010-10-31
    • 文件大小:2097152
    • 提供者:yuanhongcs
  1. 灵柩软件 可用于汉语分词处理

  2. LJParser文本搜索与挖掘开发平台的十大功能: 1. 全文精准检索 支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索,支持AND/OR/NOT以及NEAR邻近等查询语法,支持维语、藏语、蒙语、阿拉伯、韩语等多种少数民族语言的检索。可以无缝地与现有文本处理系统与数据库系统融合。 2. 新词发现: 从文件集合中挖掘出内涵的新词语列表,可以用于用户专业词典的编撰;还可以进一步编辑标注,导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化。 3. 分词标注: 对原始语料进行分词
  3. 所属分类:Web开发

    • 发布日期:2010-11-05
    • 文件大小:688128
    • 提供者:zhangguoqiang52
  1. 论文--网页设计的系统分析

  2. 一个简单的规范的网页设计系统分析学年论文,包含目录、正文、参考文献。
  3. 所属分类:网页制作

  1. 自己动手写网络爬虫

  2. 完整版《自己动手写网络爬虫》! 第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2
  3. 所属分类:专业指导

    • 发布日期:2013-10-27
    • 文件大小:28311552
    • 提供者:qq674708957
  1. 基于超链接分析的网页正文提取方法

  2. 随着网络的迅猛发展, w eb服务已经成为研究的热点之一. 本文介绍了一种文件类型网页文件的文本信息预处理技术. 该方法能够解析网页文件的组成结构, 并从中提取出主体文本以供处理. 测试表明该方法能快速有效地得到大部分HTML网页的主体部分
  3. 所属分类:网络基础

    • 发布日期:2013-11-26
    • 文件大小:1048576
    • 提供者:np163
  1. 龙蛛网页正文分析工具 附源代码

  2. 龙蛛根据网页框架自动分析网页正文,发布源代码供大家切磋
  3. 所属分类:C++

    • 发布日期:2008-10-17
    • 文件大小:445440
    • 提供者:clwgh
  1. 基于HTML标记用途分析的网页正文提取技术

  2. 基于HTML标记用途分析的网页正文提取技术
  3. 所属分类:其它

    • 发布日期:2015-07-30
    • 文件大小:623616
    • 提供者:maomaosi2009
  1. K风网页搜索系统 K-PageSearch Engine Version v2.2 sp3.rar

  2. K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP2改进:修正检索组件错误引起的
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:2097152
    • 提供者:weixin_39840650
  1. K风网页搜索 K-PageSearch v2.2 SP5.rar

  2. K-PageSearch是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 K风网页搜索V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度; SP5:修正改进搜索算
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:2097152
    • 提供者:weixin_39840515
  1. K风网页搜索系统(.NET) v2.2.rar

  2. K风网页搜索(K-PageSearch)是由Kwindsoft自主研发的专业网页搜索引擎系统,拥有先进的智能分析和海量数据检索技术,核心由多线程采集系统、智能分析系统、海量索引系统、全文检索系统四大部分构成。系统采用专业级的搜索引擎系统架构,支持海量数据毫秒级全文检索。主要面向大中型行业搜索引擎、地方搜索引擎、专类信息搜索引擎等应用领域设计的专业全文检索产品,为用户提供海量数据全文检索应用的理想解决方案。 V2.2版本主要改进:改进索引系统读写性能,提高约10倍的索引速度;V2.1版本主要改进
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:2097152
    • 提供者:weixin_39841882
  1. 红薯HtmlSucker0.0.1HTML网页信息提取工具包

  2. HtmlSucker是一款用来从一个HTML网页中提取文章信息的小工具包,例如从网页中提取文章标题、作者、发布时间、 封面图以及文章正文内容。基于 jsoup 库进行 HTML 解析。 HtmlSucker 提供两种正文提取算法: 最大文本块:分析整个 HTML 文档的所有节点,提取其中包含最多文字的的连续节点。 文本密度算法:参考 WebCollector 项目的代码 目前还处于非常简单
  3. 所属分类:其它

    • 发布日期:2019-07-24
    • 文件大小:14336
    • 提供者:weixin_39840650
  1. 网页正文提取器下载 网页正文提取器 v1.0

  2. 网页正文提取工具是一款强大的网页提取软件,该软件通过对比分析搜狐、新浪、腾讯、网易、中国新闻网、百度、21cn网、中华网等大型门户网站,详细的分析其噪音数据的特点,然后
  3. 所属分类:其它

    • 发布日期:2020-11-09
    • 文件大小:472064
    • 提供者:weixin_38691220
  1. 融合多特征的蒙汉网页新闻文本相似度计算

  2. 跨语言文本相似度计算是挖掘蒙汉可比语料的基础和关键,其结果直接影响了可比语料的质量。本文通过分析新闻文本特点,提出了一种融合多特征的跨语言新闻文本相似度计算方法。该方法首先抽取新闻的发布日期、标题及正文信息作为特征,再利用双语文档发布日期的差异、正文长度关系、正文阿拉伯数字相似度、标题重合程度及正文重合程度五种启发信息进行加权线性组合来判断相似程度。实验表明,本文提出的方法能明显提高蒙汉新闻文本相似度计算的准确率。
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:676864
    • 提供者:weixin_38502639
« 12 3 »