搜索资源 - Hadoop到结合 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Hadoop到结合

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

基于Hadoop的分布式搜索引擎研究与实现
分布式搜索引擎是一种结合了分布式计算技术和全文检索技术的新型信息检索系统。它改变了人们获取信息的途径，让人们更有效地获取信息，现在它已经深入到网络生活的每一方面，被誉为上网第一站。
所属分类：Java
- 发布日期：2011-06-03
- 文件大小：2097152
- 提供者：cool_time

Gluster_Hadoop_Compatible_Storage.pdf
Glusterfs（分布式文件系统） Hadoop到结合
所属分类：群集服务
- 发布日期：2012-08-14
- 文件大小：364544
- 提供者：hj19870806

HdfsWeb.rar
这个小的例子是本人直接结合hadoop集群和web一起开发的上传和下载功能，把本地文件上传到云端和从云端下载到本地。
所属分类：Java
- 发布日期：2013-06-08
- 文件大小：921600
- 提供者：guofeng2010

Hive和Hase配置
配置hive-0.9.0和hbase-0.94.1结合使用，部分内容如下： 1.拷贝hbase-0.94.1.jar和zookeeper-3.4.3.jar到hive/lib下。注意：如hive/lib下已经存在这两个文件的其他版本，建议删除后使用hbase下的相关版本。 //在/home/hadoop/hive-0.9.0/lib 下，备份两个jar包 mv hbase-0.92.0.jar hbase-0.92.0.jar.bak mv zookeeper-3.4.3.jar zooke
所属分类：其它
- 发布日期：2013-07-01
- 文件大小：3072
- 提供者：xin_jmail

Hadoop 入门pdf文档
Hadoop 入门文档 Hadoop 的系统中，会有一台Master，主要负责NameNode 的工作以及JobTracker 的工作。JobTracker 的主要职责就是启动、跟踪和调度各个Slave 的任务执行。还会有多台Sl ave，每一台Slave 通常具有DataNode 的功能并负责TaskTracker 的工作。TaskTracker 根据应用要求来结合本地数据执行Map 任务以及Reduce 任务。说到这里，就要提到分布式计算最重要的一个设计点：Moving Compu
所属分类：其它
- 发布日期：2013-12-04
- 文件大小：301056
- 提供者：kingjin55

Storm入门教程之Storm原理和概念详解
Storm流计算从入门到精通之技术篇(高并发策略、批处理事务、Trident精解、运维监控、企业场景) Storm入门教程之Storm原理和概念详解，出自Storm流计算从入门到精通之技术篇，Storm入门视频教程用到技术：Storm集群、Zookeeper集群等，涉及项目：网站PV、UV案例实战、其他案例； Storm视频教程亮点： 1、Storm全面、系统、深入讲解，采用最新的稳定版本Storm 0.9.0.1 ； 2、注重实践，对较抽象难懂的技术点如Grouping策略、并发度及线程安
所属分类：数据库
- 发布日期：2014-07-18
- 文件大小：33554432
- 提供者：u013802231

开源力量——数据挖掘原理与实战
整套大数据课程从hadoop入门开始，由浅入深，内置“hadoop源码解析与企业应用开发实战”，“Hive开发实战”，“Hbase开发实战”，“Spark，mahout，sqoop，storm诸模块开发实战”，“数据挖掘基础。这个系列课程有几个板块组成，所以学员可以按照自己的实际情况选择学习。例如，对于只需要了解hadoop基本编程的人，只需要选择“hadoop源码解析与企业应用开发实战”模块就可以了；对于立志于从事大数据领域的零起点人员，可以选择四个板块依次学习；对于已经有一定基础的hado
所属分类：Java
- 发布日期：2015-07-10
- 文件大小：74
- 提供者：billdavidup2015

Hadoop技术内幕深入理解MapReduce架构设计与实现原理.pdf
Hadoop技术内幕：深入解析MapReduce架构设计与实现原理目录前言第一部分基础篇第1章阅读源代码前的准备 1.1 准备源代码学习环境 1.1.1 基础软件下载 1.1.2 如何准备Windows环境 1.1.3 如何准备Linux环境 1.2 获取Hadoop源代码 1.3 搭建Hadoop源代码阅读环境 1.3.1 创建Hadoop工程 1.3.2 Hadoop源代码阅读技巧 1.4 Hadoop源代码组织结构 1.5 Hadoop初体验 1.5.1 启动Hadoop 1
所属分类：Java
- 发布日期：2015-11-24
- 文件大小：48234496
- 提供者：yuan_xw

Python示例-从基础到高手PDF
目录第1章 Python 处理 cassandra 升级后的回滚脚本第 2 章多套方案来提高 python web 框架的并发处理能力第 3 章 python 写报警程序中的声音实现 winsound 第 4 章一个脚本讲述 python 语言的基础规范，适合初学者第 5 章 python 计算文件的行数和读取某一行内容的实现方法第 6 章 python 中用 string.maketrans 和 translate 巧妙替换字符串第 7 章 python linecache
所属分类：Python
- 发布日期：2017-10-25
- 文件大小：10485760
- 提供者：netghost1919

基于Hadoop的并行共享决策树挖掘算法研究
共享知识挖掘是指通过学习不同事物之间的共享知识,将学习到的知识应用到未知事物来加快认知未知事物。针对大数据集中串行共享知识挖掘算法效率低下的问题,结合云计算技术,提出了一种基于Hadoop的并行共享决策树挖掘算法(PSDT)。该算法采用传统的属性表结构实现并行挖掘,但其I/O操作过多,影响算法性能,为此,进一步提出了一种混合并行共享决策树挖掘算法(HPSDT)。该算法采用混合数据结构,在计算分裂指标阶段使用属性表结构,在分裂阶段采用数据记录结构。数据分析表明,HPSDT算法简化了分裂过程,其I
所属分类：Hadoop
- 发布日期：2018-07-03
- 文件大小：614400
- 提供者：qq_28339273

IT十八掌徐培成大数据培训资料
精心规划，课程涵盖Hadoop大数据生态圈全方位剖析，做到知识无死角，挑战高薪大数据职位；循序渐进，由浅入深学习大数据技能，大数据处理技术方方面面一览无余，积跬步以至千里。企业案例，理论与实际相结合，技术与操作同进行，学以致用，止于至善。从内到外理解大数据各种技术，HBase，Hive，Pig，Zookeeper等等技术源码级传授，从无到有掌握Hadoop技术。
所属分类：Java
- 发布日期：2018-08-24
- 文件大小：238
- 提供者：michaelgao123

Hadoop集群部署实例
由于工作需要，最近一段时间开始接触学习 Hadoop 相关的东西，目前公司的实时任务和离线任务都跑在一个 Hadoop 集群，离线任务的特点就是每天定时跑，任务跑完了资源就空闲了，为了合理的利用资源，我们打算在搭一个集群用于跑离线任务，计算节点和储存节点分离，计算节点结合 aws 的 Auto Scaling（自动扩容、缩容服务）以及竞价实例，动态调整，在跑任务的时候拉起一批实例，任务跑完就自动释放掉服务器，本文记录下 Hadoop 集群的搭建过程，方便自己日后查看，也希望能帮到初学者，
所属分类：Hadoop
- 发布日期：2018-02-06
- 文件大小：1048576
- 提供者：tornadom

2017最新大数据架构师精英课程
本资源为大数据基础到中高级教学资源，适合稍微有点大数据或者java基础的人群学习，资源过大，上传乃是下载链接，不多说，上目录： 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
所属分类：Java
- 发布日期：2018-11-01
- 文件大小：274
- 提供者：weixin_38652136

基于Hadoop的煤炭企业数据共享系统设计
针对煤炭企业数据处理能力的不足,将云计算技术应用到煤炭企业数据共享体系中,提出了一个利用Hadoop平台对煤炭企业数据进行高效共享的系统。首先,介绍了Hadoop平台及其关键技术;而后建立了应用于煤炭企业的数据共享模型,该模型抽取源数据并通过数据集成存储于数据仓库;最后结合煤炭企业实际需求,设计了数据管理平台,完成了数据集成、模型和并行关联算法的设计。
所属分类：其它
- 发布日期：2020-07-08
- 文件大小：283648
- 提供者：weixin_38654944

bi_development_source_code:传统大数据分析工具以Hadoop，Spark为代表，集成集成的技术框架，对用户来说又重又笨又不灵活，难以维护和驾驭，国际和国内的敏捷型BI工具在对接时又面临性能本项目独辟蹊径，以阿里开源
数据挖掘传统大数据分析工具以Hadoop，Spark为代表，集成集成的技术框架，对用户来说又重又笨又不灵活，难以维护和驾驭，国际和国内的敏捷型BI工具在对接时又面临性能本项目独辟蹊径，以阿里开源的DataX为ETL工具，以列式数据库ClickHouse做为中间数据存储源，通过视图关联构建大数据集，解决亿万级数据的即时分析性能，再辅以强大的数据可视化设计前端，通过用户自定义菜单和模板进行呈现，实现用户的自助式分析和探索。通过灵活的预警功能，设置一些自定义的监控指标，当监控指标超过异常值时，系统
所属分类：其它
- 发布日期：2021-03-24
- 文件大小：80740352
- 提供者：weixin_42173218

四种方案：将OpenStack私有云部署到HadoopMapReduce环境中
OpenStack与Hadoop被誉为继Linux之后最有可能获得巨大成功的开源项目。这二者如何结合成为更猛的新方案？业内给出两种答案：Hadoop跑在OpenStack上或OpenStack部署到Hadoop上。SteveMarkey教授重点介绍了后者。这两种答案都有企业在实践。“Hadoop跑在OpenStack上”可以参考《ProjectSavanna：让Hadoop运行在OpenStack之上》，“OpenStack部署到Hadoop上”则重点可查阅本文。随着企业开始同时利用云计算和大数
所属分类：其它
- 发布日期：2021-03-02
- 文件大小：223232
- 提供者：weixin_38731385

Spark与Hadoop的结合
本文来自于csdn，本文介绍了Spark是基于内存的迭代计算框架，适用于需要多次操作特定数据集的应用场合。Spark可以直接对HDFS进行数据的读写，同样支持SparkonYARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。RDD是Spark的最基本抽象,是对分布式内存的抽象使用，实现了以操作本地集合的方式来操作分布式数据集的抽象实现。RDD是Spark最核心的东西，它表示已被分区，不可变的并能够被并行操作
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：276480
- 提供者：weixin_38502814

Enrich-data-using-HDFS：该项目结合了加拿大加拿大大都会蒙特利尔的STM_GTFS的实时数据。这些文件存储在Hadoop文件系统（HDFS）中，该项目从HDFS中提取输入文件并丰富他们一起成为一个文件，并将写回到HDFS
＃Enrich-data-using-HDFS该项目组合了加拿大国家/地区的大都会蒙特利尔STM_GTFS的实时数据。文件存储在Hadoop文件系统（HDFS）中，该项目从HDFS中提取输入文件并进行充实将它们一起存储到一个文件中，并将其写回到HDFS中。在ETL管道泛化的这个项目中，|配置Hadoop API |与Hadoop HDFS API一起使用|了解如何更改管道以与多个数据源一起使用将输入文件（行程，路线，日历）从STM-GTFS存储库下载到Hadoop文件系统（HDFS），并相
所属分类：其它
- 发布日期：2021-02-18
- 文件大小：7168
- 提供者：weixin_42104778

结合使用Hadoop和Couchbase
简介：Hadoop非常适合处理大量数据并将该信息解析为您可查询的较小的信息集。但是，通过与CouchbaseServer集成，您可以对信息执行实时查询和报告，同时继续使用Hadoop处理大型数据集和数据集的繁重处理工作。CouchbaseServer还使用了一个MapReduce查询系统，这使您能够轻松地迁移和集成索引和查询系统，从而有效地提取和操作信息。Hadoop将许多重要特性结合在一起，这使Hadoop对于将大量数据分解为更小、实用的数据块非常有用。Hadoop的主要组件是HDFS文件系统
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：144384
- 提供者：weixin_38630091

四种方案：将OpenStack私有云部署到HadoopMapReduce环境中
OpenStack与Hadoop被誉为继Linux之后最有可能获得巨大成功的开源项目。这二者如何结合成为更猛的新方案？业内给出两种答案：Hadoop跑在OpenStack上或OpenStack部署到Hadoop上。SteveMarkey教授重点介绍了后者。这两种答案都有企业在实践。“Hadoop跑在OpenStack上”可以参考《ProjectSavanna：让Hadoop运行在OpenStack之上》，“OpenStack部署到Hadoop上”则重点可查阅本文。随着企业开始同时利用云计算和大数
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：223232
- 提供者：weixin_38720050

« 12 »