您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. nutch搜索引擎windows版本part1

  2. nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,循环线程的实现方式,如有不明白的地方,可联系我qq511134962,msn:myhongkongzhen@gmail.com
  3. 所属分类:Java

    • 发布日期:2009-05-05
    • 文件大小:9437184
    • 提供者:myhongkongzhen
  1. nutch搜索引擎windows版本part2

  2. nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,循环线程的实现方式,如有不明白的地方,可联系我qq511134962,msn:myhongkongzhen@gmail.com
  3. 所属分类:Java

    • 发布日期:2009-05-05
    • 文件大小:8388608
    • 提供者:myhongkongzhen
  1. nutch搜索引擎windows版本修改版

  2. nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,循环线程的实现方式,如有不明白的地方,可联系我qq511134962,msn:myhongkongzhen@gmail.com
  3. 所属分类:其它

    • 发布日期:2009-05-26
    • 文件大小:8388608
    • 提供者:myhongkongzhen
  1. nutch搜索引擎windows版本修改版part2

  2. nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,循环线程的实现方式,如有不明白的地方,可联系我qq511134962,msn:myhongkongzhen@gmail.com
  3. 所属分类:其它

    • 发布日期:2009-05-26
    • 文件大小:8388608
    • 提供者:myhongkongzhen
  1. nutch搜索引擎windows版本修改版part3

  2. nutch搜索引擎windows版本,运行bat文件即可,包含中文分词技术,采用IKAnalyzer。jar分词插件,并做了自定义关键分词的修改,可根据自己从事的行业关键字做分词,在此感谢原作者,实现每天晚上1点钟运行爬行工作,循环线程的实现方式,如有不明白的地方,可联系我qq511134962,msn:myhongkongzhen@gmail.com
  3. 所属分类:其它

    • 发布日期:2009-05-26
    • 文件大小:1044480
    • 提供者:myhongkongzhen
  1. Nutch入门学习(中文)

  2. Nutch入门学习,对nutch配置,运行流程,架构特征,核心技术,都做了分析探讨,是不可多的的nutch入门资料。
  3. 所属分类:专业指导

    • 发布日期:2009-05-31
    • 文件大小:1048576
    • 提供者:wxx19840805
  1. 基于lucene和nutch的开源搜索引擎资料集合

  2. 其中内容均为前段时间研究开源搜索引擎时搜集参考的资料,非常齐全包含的内容有: Computing PageRank Using Hadoop.ppt Google的秘密PageRank彻底解说中文版.doc JAVA_Lucene_in_Action教程完整版.doc Java开源搜索引擎.doc Linux下Nutch分布式配置和使用.pdf Lucene+Nutch源码.rar Lucene学习笔记.doc nutch_tutorial.pdf nutch二次开发总结.txt nutch入
  3. 所属分类:Java

    • 发布日期:2011-01-19
    • 文件大小:5242880
    • 提供者:greatman4551
  1. Nutch入门

  2. 前几天看到卢亮的 Larbin 一种高效的搜索引擎爬虫工具 一文提到 Nutch,很是感兴趣,但一直没有时间进行测试研究。趁着假期,先测试一下看看。用搜索引擎查找了一下,发现中文技术社区对 Larbin 的关注要远远大于 Nutch 。只有一年多前何东在他的竹笋炒肉中对 Nutch 进行了一下介绍。Nutch vs Lucene Lucene 不是完整的应用程序,而是一个用于实现全文检索的软件库。Nutch 是一个应用程序,可以以 Lucene 为基础实现搜索引擎应用
  3. 所属分类:专业指导

    • 发布日期:2008-04-18
    • 文件大小:1048576
    • 提供者:minzaipiao
  1. nutch 入门教程

  2. Nutch是一个开源的、Java实现的搜索引擎。它提供了我们运行自己的搜 索引擎所需的全部工具。 本教程主要讲述nutch如何使用,以及运行原理和用到的关键技术,比较适合初学者使用。
  3. 所属分类:Java

    • 发布日期:2011-12-22
    • 文件大小:1048576
    • 提供者:ren50486
  1. Lucene+Nutch本书源码+详细说明

  2. Lucene+Nutch本书源码+详细说明,研究搜索引擎具体抓取与解析等技术问题,有利于搜索引擎开发新手的熟悉与了解,难得的电子版,值得珍藏
  3. 所属分类:Java

    • 发布日期:2012-03-23
    • 文件大小:22020096
    • 提供者:zhangbdaxia
  1. apache的nutch爬虫源代码

  2. 针对apache的爬虫技术nutch的设计思想和理解,从源码开始学习~~
  3. 所属分类:Java

    • 发布日期:2012-12-15
    • 文件大小:4194304
    • 提供者:vltic
  1. Nutch公开课从搜索引擎到网络爬虫

  2. 课程背景:Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,最大的区别在于2.X对底层的数据存储进行了抽象以支持各种底层存储技术。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理的事实上的标准。Tika使用多种现有的开
  3. 所属分类:Java

    • 发布日期:2013-09-24
    • 文件大小:2097152
    • 提供者:yangshangchuan
  1. Nutch相关框架视频教程讲义 (1-20)

  2. . Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用Nutch抓!学了Hadoop的Map Reduce以及HDFS,没有实用案例怎么办?学习Nutch!Nutch的很多代码是用Map Reduce和HDFS写的,哪里还能找到比Nutch更好的Hadoop应用案例呢? 大数据这个术语最早的引用可追溯到Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。现在,大数据的含义已经被极
  3. 所属分类:Java

    • 发布日期:2013-09-24
    • 文件大小:843776
    • 提供者:yangshangchuan
  1. 基于Nutch技术的主题搜索引擎实现_李东海.caj

  2. 基于Nutch技术的主题搜索引擎实现_李东海.caj
  3. 所属分类:Java

    • 发布日期:2013-12-05
    • 文件大小:2097152
    • 提供者:baoendemao
  1. 基于Java的搜索引擎Nutch中文搜索技术研究

  2. 基于Java的搜索引擎Nutch中文搜索技术研究 摘要:Nutch是一个优秀的基于Java的开放源码搜索引擎,为了使它能够支持中文搜索,本文在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能。 关键词:搜索引擎; 分词; 正规
  3. 所属分类:Java

    • 发布日期:2008-10-10
    • 文件大小:12288
    • 提供者:juicewall
  1. Nutch入门教程

  2. 爬虫入门技术文档,对于新手来说,值得推荐! 大家可以下载看看
  3. 所属分类:Java

    • 发布日期:2015-09-25
    • 文件大小:1048576
    • 提供者:liubiaoxin
  1. 基于Nutch中文分词的研究与实现

  2. 作为舆情监测系统的一部分,本文的目标是基于Nutch,同时,结合目前最常用中文分词技术,根据不同的中文分词方法,实验并得出不同分词方法在性能以及使用环境上的优缺点,以此为舆情监测系统选择合适的中文分词方法,为系统下一步的实现打下基础。
  3. 所属分类:网管软件

    • 发布日期:2015-10-26
    • 文件大小:2097152
    • 提供者:aijava_1990
  1. Nutch技术的主题搜索引擎实现_李东海

  2. Nutch技术的主题搜索引擎实现_李东海
  3. 所属分类:Java

    • 发布日期:2016-06-21
    • 文件大小:2097152
    • 提供者:wuwangwr11
  1. nutch ,爬虫

  2. Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。 Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,这两大分支最大的区别在于2.X对底层的数据存储进行
  3. 所属分类:硬件开发

    • 发布日期:2016-09-21
    • 文件大小:1048576
    • 提供者:liuxuuebin
  1. 面向网络化制造资源的垂直搜索技术研究与应用

  2. 面向网络化制造资源的垂直搜索技术研究与应用 nutch和lucene 一篇硕士生毕业论文。
  3. 所属分类:网络基础

    • 发布日期:2008-12-05
    • 文件大小:2097152
    • 提供者:lhyit
« 12 3 »