您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. nekohtml-1.9.13.zip

  2. nekohtml-1.9.13.zip 最新版,流行HTML解析器 nutch也使用它。
  3. 所属分类:Web开发

    • 发布日期:2009-12-15
    • 文件大小:7340032
    • 提供者:mythee
  1. 应用Web挖掘的主题元搜索引擎的设计与实现

  2. 本论文介绍了应用Web数据挖掘,基于开源搜索引擎Nutch 0.9及相关软件包,结合主题搜索引擎和元搜索引擎的特点,设计和实现一个主题元搜索引擎TSMSE,借以改善通用全文搜索引擎的查全率和查准率。 论文首先开发了主题提取器TopicDistiller,应用Web内容挖掘和Web链接分析,从通用搜索引擎检索结果网页集中提取主题词集和种子站点用于主题表示,为后续主题元搜索引擎的主题判断和主题度计算提供了依据。 论文接着提出了具有独立数据库的主题元搜索引擎TSMSE的设计思想,将元搜索引擎综合各个
  3. 所属分类:Web开发

    • 发布日期:2010-01-10
    • 文件大小:4194304
    • 提供者:yangdanbo1975
  1. 工程硕士论文中用到的源代码

  2. 本人在做工程硕士论文时写的工程源码,包括对Nutch 0.9搜索引擎查询页面的修改和优化、自己开发的页面解析、索引和排序插件、主题搜索引擎种子站点和主题词集的收集和索引工具以及元搜索引擎的数据存储。
  3. 所属分类:Java

    • 发布日期:2010-04-10
    • 文件大小:137216
    • 提供者:yangdanbo1975
  1. Eclipse中编译Nutch-0.9

  2. Eclipse 编译 Nutch-0.9
  3. 所属分类:Java

    • 发布日期:2010-05-28
    • 文件大小:1048576
    • 提供者:zklth
  1. nutch-0.9 环境搭建所需最小cygwin

  2. 参考文章 http://blog.csdn.net/handyhuang/article/details/7421553
  3. 所属分类:其它

    • 发布日期:2012-04-02
    • 文件大小:2097152
    • 提供者:handyhuang
  1. luke-src-0.9.9

  2. Luke是用来查看lucene格式索引的工具。而nutch的索引采用的就是lucene格式,所以,luke就成为查看nutch索引的利器。
  3. 所属分类:其它

    • 发布日期:2012-07-24
    • 文件大小:5242880
    • 提供者:beizi1732
  1. apache-nutch-1.6-bin.tar.gz最新版

  2. nutch不用安装,是个应用程序,下载后为nutch-1.6.tar.gz,双击桌面上的cygwin快捷方式;执行以下命令: $ cd D:/Downloads/Soft $ tar zxvf nutch-1.0.tar.gz 在e盘下面出现nutch-0.9文件夹说明解压成功了.然后环境变量设置为NUTCH_JAVA_HOME=C:\Program Files\Java\jdk1.5.0(也就是说跟JAVA_HOME是相同的).测试nutch是否安装成功,只需要执行以下命令: $cd D:/
  3. 所属分类:Web开发

    • 发布日期:2013-03-15
    • 文件大小:48234496
    • 提供者:hm_1987
  1. Nutch 1.7 Windows 批处理脚本

  2. Nutch 脱离Cygwin直接在Windows下运行。 修正批处理最大只能直接传9个参数的问题。
  3. 所属分类:Web开发

    • 发布日期:2013-10-01
    • 文件大小:5120
    • 提供者:lendywoo
  1. AnyFo – Nutch 冰破银针

  2. 1.6 Tomcat中启动搜索站台 1. 将Nutch.war包考到Tomcat的webapps下。 部署后,进入站台目录下的WEB-INF\classes,找到“nutch-site.xml”文件,打开,向其中根节点添加: searcher.dir E:\nutch-0.9\crawl 2. 启动Tomcat,输入http://127.0.0.1:8080/nutch-0.9 3. 可以进行查询了。
  3. 所属分类:Java

    • 发布日期:2008-10-14
    • 文件大小:308224
    • 提供者:hjh202537
  1. nutch-1.9 源码

  2. 好用的爬虫工具,刚发布不久的新版本 nutch是网络搜索及信息提取中使用得最广泛的网络爬虫工具 仅仅使用简单的配置就可以实现强大的爬取信息功能
  3. 所属分类:Java

    • 发布日期:2014-09-20
    • 文件大小:4194304
    • 提供者:u010469490
  1. 中文分词工具word-1.0,Java实现的中文分词组件多种基于词典的分词算法

  2. word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。 分词使用方法: 1、快速体验 运行项目根目录下的脚本demo-word.bat可以快速体验分词效果 用法: command [text] [input] [output] 命令command的可选值为:demo、text、file
  3. 所属分类:Java

    • 发布日期:2014-11-05
    • 文件大小:10485760
    • 提供者:love_hachi
  1. nutch09版本

  2. 亲测好用
  3. 所属分类:网络管理

    • 发布日期:2016-11-14
    • 文件大小:55574528
    • 提供者:qq_29721419
  1. nutch 0.9分页代码(粘贴可用)

  2. nutch 0.9分页代码(粘贴可用)
  3. 所属分类:其它

    • 发布日期:2017-05-08
    • 文件大小:3072
    • 提供者:zdk_csdn
  1. hadoop-core-1.2.0.jar

  2. 解决nutch 1.9在cgywin中运行报Injector: java.io.IOException: Failed to set permissions of path: \tmp\hadoop-Administrator\mapred\staging\Administrator139727905\.staging to 0700错误的问题,即修改hadoop-core-1.2.0.jar中FileUtil.java类中checkReturnValue方法后jar包
  3. 所属分类:Hadoop

    • 发布日期:2017-10-16
    • 文件大小:4194304
    • 提供者:xzf19901108
  1. nutch0。9版本

  2. Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎
  3. 所属分类:Web开发

    • 发布日期:2009-03-17
    • 文件大小:70254592
    • 提供者:yisanming
  1. apach-nutch-1.9-bin.tar.gz

  2. 用于搭建一个建议搜索引擎的工具,相比nutch2.x,nutch1.x比较稳定,并且不需要安装hbase等非关系数据库
  3. 所属分类:其它

    • 发布日期:2018-04-12
    • 文件大小:71303168
    • 提供者:qq_34229391
  1. sulr-4.9.1

  2. Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒置,而且附带了一个 基于 HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩 展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码, Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。此外,很多 Luc
  3. 所属分类:Java

    • 发布日期:2018-11-06
    • 文件大小:155189248
    • 提供者:qq_43616154
  1. Linux下Nutch分布式配置和使用.rar

  2. 这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。 目 录 介绍 ............................................................... 2 0 集群网络环境介绍 ................................................. 2 1 /etc/hosts文件配置 ...........................
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:480256
    • 提供者:weixin_39841848
  1. Nutch入门.rar

  2. Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 目 录 1. nutch简介...1 1.1什么是nutch..1 1.2研究nutch的原因...1 1.3 nutch的目标..1 1.4 nutch VS lucene.....2 2. nutch的安装与配置.....3 2.1 JDK的安装与配置.3 2.2 nutch的安装与配置........5 2.3 tomcat的安装与配置......5 3. nutch初体验7 3.1 爬行
  3. 所属分类:其它

    • 发布日期:2019-07-09
    • 文件大小:935936
    • 提供者:weixin_39840387
  1. nutch入门.pdf

  2. NULL 博文链接:https://qidaoxp.iteye.com/blog/1072832入门学习 概述 文件系统语法 文件系统设计 系统的可用性 文件系统工作架构 应用 修改源码 插件机制 什么是 使用的好处 工作原理 编 接口 使用 使用 的应用前景 附录一 的相关网站 附录二参考文献 北京邮电大学一李阳 入门学习 简介 什么是 是一个开源的、实现的搜索引擎。它提供了我们运行自己的搜 索引擎所需的全部工具。 研究 的原因 可能有的朋友会有疑问我们有 有百度为何还需要建立自己的搜索 引
  3. 所属分类:其它

    • 发布日期:2019-03-23
    • 文件大小:1048576
    • 提供者:weixin_38669628
« 12 »