您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. 高可用性的HDFS:Hadoop分布式文件系统深度实践

  2. 第1章 HDFS HA及解决方案 1.1 HDFS系统架构 1.2 HA定义 1.3 HDFS HA原因分析及应对措施 1.3.1 可靠性 1.3.2 可维护性 1.4 现有HDFS HA解决方案 1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的SecondaryNameNode方案 1.4.3 Hadoop的Checkpoint ode方案 1.4.4 Hadoop的BackupNode方案 1.4.5 DRDB方案 1.4.6 FaceBook的AvatarNode方案
  3. 所属分类:群集服务

    • 发布日期:2014-05-15
    • 文件大小:6291456
    • 提供者:ysjian_pingcx
  1. Hadoop应用开发实战详解源代码

  2. Hadoop应用开发实战详解源代码  第4章 初识MapReduce   4.1 MapReduce简介     4.1.1 MapReduce要解决什么问题     4.1.2 MapReduce的理论基础     4.1.3 MapReduce的编程模式    4.2 MapReduce的集群行为    4.3 Map/Reduce框架    4.4 样例分析:单词计数     4.4.1 WordCount实例的运行过程     4.4.2 WordCount的源码分析和程序处理过程 
  3. 所属分类:Java

    • 发布日期:2015-05-25
    • 文件大小:202752
    • 提供者:syilo
  1. hadoop大数据实战手册

  2. 第一部分核心设计篇 第1 章HDFS 的数据存储………….. .....………………… ……………………····· ··· …..... ... 2 1.1 HDFS 内存存储...............…··························· ·· ···············…….................…... . .. .. ................. 2 1.1.l HDFS 内存存储原理..................…... . .....
  3. 所属分类:Hadoop

    • 发布日期:2018-09-07
    • 文件大小:68
    • 提供者:hanye210
  1. 尚gg大数据项目实战电商数仓系统开发教程.txt

  2. 01_数仓项目介绍.avi4 b4 Q* Q8 Z0 Y) C6 O! w 02_数仓采集_用户行为采集课程介绍.avi8 \7 f3 O. c- {: v# W& V$ Y& b 03_数仓采集_数仓的概念.avi8 Z# X* q/ c; }3 A* [ T 04_数仓采集_项目需求.avi6 B8 n s0 h! M4 X# j! |0 ` 05_数仓采集_项目技术选型.avi8 [% N% W, U# y5 s 06_数仓采集_系统数据流程设计.avi8 N: L Y6 D6 y 07
  3. 所属分类:Hive

  1. BigDataSalaryAnaliySystem:大数据招聘信息分析平台-源码

  2. ##大数据招聘信息分析平台##这是依据爬取程序,爬取到的招聘信息进行各维度的分析并展现最终结果的平台 ###平台环境### Centos 7 Hadoop-2.5.1 动物园管理员3.4.6 HBase-1.1.2 蜂巢1.2.1 MySQL的5.6 的Python 3.5 JDK 1.8 建造过程可参考: ###平台项目结构### 爬取项目(爬虫),使用Python编写 加载数据到HBase数据库项目,使用Java编写 Web端展现项目,使用Java编写 ###各项目功能###
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:89128960
    • 提供者:weixin_42122988
  1. hadoop-2.7.1:Hadoop源码分析-源码

  2. hadoop-2.7.1:Hadoop源码分析
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:26214400
    • 提供者:weixin_42151036
  1. SparkInternals:有关Apache Spark设计和实现的说明-源码

  2. Spark内部 Spark版本:1.0.2 Doc版本:1.0.2.0 作者 微博/ Twitter ID 姓名 会费 徐立杰 作者的原始中文版本,以及英文版本更新 韩菊 英文版和更新(第0、1、3、4和7章) 郝仁 英文版和更新(第2、5和6章) Bhuridech Sudsee 泰文版 介绍 本系列讨论Apache Spark的设计和实现,重点在于其设计原理,执行机制,系统架构和性能优化。 此外,在设计和实现方面与Hadoop MapReduce进行了一些比较。 我不愿意将此文档
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:66060288
    • 提供者:weixin_42139429
  1. JAVA-dataAnalysis:基于Hadoop小型数据分析项目的设计与实现-源码

  2. 本地环境:CentOS 7 + HDFS(dfs-node01,dfs-node02) 数据分析 数据源:gps.scv 数据分类描述:VehicleId:出租车标识符时间:数据收集时间经度:经度纬度:纬度速度:速度方向:方向,与正北方向夹角乘客状态:载客情况,1为载客,0为空车 运行效果 806404129594 2010-09-02 09:22:57 118.767583 32.085087999999999 2 0 1 806404129594 2010-09-02 09:23:09 1
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:145408
    • 提供者:weixin_42153615
  1. SparkStreaming:Spark Streaming + Flume + Kafka + HBase + Hadoop + Zookeeper实现实时日志分析统计; SpringBoot + Echarts实现数据可视化展示-源码

  2. 避免流式传输 前言:使用scala和java混编完成,其中也涉及到python脚本来自动生成日志,linux crontab调度工具来定时执行脚本生成实时日志。生成的数据主要是模拟某学习网站学习视频课程的访问量(其中*以“ / class”开头的表示实战课程,然后通过流水线Flume + Kafka + SparkStreaming进行实时日志的收集,HBase来存储数据)* 注意事项(使用的软件工具及环境配置) hadoop-2.6.0-cdh5.7.0 hbase-1.2.0-cdh5.
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:943104
    • 提供者:weixin_42143806
  1. spark-源码

  2. 阿帕奇火花 下载Spark 本地版本: 日期:2021年3月 Spark版本3.1.1; 程序包类型“为Hadoop 2.7预先构建”; openjdk 15.0.2; python 3.9.2和pyspark; PySpark外壳 在Linux / OS X上启动PySpark $HOME/spark-3.1.1-bin-hadoop2.7/bin/pyspark 或使用pip安装并启动pyspark pip install pyspark pyspark 理论 参考:《火花在行动》第
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:3072
    • 提供者:weixin_42127783