您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Yarn框架代码详细分析V0.5

  2. Hadoop的2.0版本的yarn的框架介绍啊 Hadoop yarnYARN 本身框架的优势是扩展性与支持多计算模型。对于扩展性目前主要体现在计算节点规模上,以前 JobTracker-TaskTracker 模型下最多大约在 5000 台机器左右,对于 YARN,官方说可以支持大约 10w 台机器,当然这个目前还没有一家公司去试用过,连 300 台机器目前估计也是测试阶段。 对于支持多计算模型,目前 YARN 理论是可以支持更多的计算模型的,如: MAP-REDUCE、 MPI、 Gira
  3. 所属分类:讲义

    • 发布日期:2014-08-15
    • 文件大小:1048576
    • 提供者:u011440440
  1. Hadoop(HDFS、YARN、HBase、Hive和Spark等)默认端口表

  2. 端口 作用 9000 fs.defaultFS,如:hdfs://172.25.40.171:9000 9001 dfs.namenode.rpc-address,DataNode会连接这个端口 50070 dfs.namenode.http-address 50470 dfs.namenode.https-address 50100 dfs.namenode.backup.address 50105 dfs.namenode.backup.http-address 50090 dfs.nam
  3. 所属分类:Java

    • 发布日期:2014-10-29
    • 文件大小:1024
    • 提供者:baidu_22669509
  1. Hadoop MapReduce原理

  2. 本文分别对传统MapReduce和YARN的体系结构、工作流程及故障处理等三个方面进行讲解,让你深入理解MapReduce的工作原理
  3. 所属分类:群集服务

    • 发布日期:2015-07-14
    • 文件大小:459776
    • 提供者:zhangbaolin
  1. 实施Hadoop集群

  2. Hadoop2.6集群环境搭建(HDFS HA+YARN)原来4G内存也能任性一次。 准备工作: 1、笔记本4G内存 ,操作系统WIN7 (屌丝的配置) 2、工具VMware Workstation 3、虚拟机...
  3. 所属分类:专业指导

    • 发布日期:2015-08-31
    • 文件大小:1048576
    • 提供者:kehuan147
  1. Hadoop YARN

  2. Hadoop2的资源管理系统。tez、SAPRK都是基于YARN来构建的。
  3. 所属分类:其它

    • 发布日期:2017-03-30
    • 文件大小:17825792
    • 提供者:belovedmilan
  1. hadoop 默认配置大全

  2. core-default.xml、hdfs-default.xml、mapred-default.xml、yarn-default.xml
  3. 所属分类:Hadoop

    • 发布日期:2017-07-02
    • 文件大小:41984
    • 提供者:weixin_32265569
  1. 细细品味架构·Hadoop 2015技术发展与2016发展趋势(第10期)

  2. 1、本期内容 1.1 版权申明 1.2 内容之一 1.2.1 HDFS 1.2.2 YARN 1.2.3 2016 年发展趋势 1.2.4 现场答疑(Q&A) 1.3 内容之二 1.3.1 新API 接口 1.3.2 多个 Region 副本 1.3.3 Family 粒度的 Flush 1.3.4 RPC 读写队列分离 1.3.5 在线调整配置 1.3.6 社区的工作方向和趋势 1.3.7 现场答疑(Q & A) 2、知识扩展 2.1 Hadoop 十年解读与发展预测 2.1.1 年史篇 2
  3. 所属分类:Java

    • 发布日期:2017-10-29
    • 文件大小:2097152
    • 提供者:jsntghf
  1. YARN应用场景、原理与资源调度

  2. 主要描述hadoop之YARN的应用场景、实现原理与资源调度
  3. 所属分类:Hadoop

    • 发布日期:2017-10-31
    • 文件大小:1048576
    • 提供者:u012106397
  1. Hadoop学习整理的基础知识包含MapReduce和Hive(思维导图形式)

  2. Hadoop学习整理的基础知识(思维导图) 1、初始Hadoop 2、Hadoop分布式文件系统 3、Hadoop分布式计算框架 4、Hadoop资源管理器Yarn 5、基于Hadoop的数据仓库Hive
  3. 所属分类:Hadoop

    • 发布日期:2017-11-03
    • 文件大小:6291456
    • 提供者:simuhunluo
  1. 《Hadoop技术内幕深入解析YARN架构设计与实现原理》.(董西成).[PDF]@ckook

  2. 通过此书的详细讲述、让君能够透彻认知Yarn细节、打通任督二脉;章节详细全是干货
  3. 所属分类:Hadoop

    • 发布日期:2018-05-10
    • 文件大小:187695104
    • 提供者:qq_28964847
  1. MapReduce(原理、资源设置、代码、优化等)hadoop总结

  2. 一、Hadoop基础 1、分布式概念 2、Hadoop特性 3、Hadoop四大核心模块介绍 4、Hadoop HDFS构架解析 5、YARN构架解析 二、HDFS 1、文件系统 2、初始化与启动 3、编程API 三、YARN资源管理 1、各模块职能 2、内存、CPU资源 四、MapReduce编程 五、MapReduce的优化 六、基于Zookeeper的HA 七、MapReduce经典案例 。 。 。
  3. 所属分类:Hadoop

    • 发布日期:2018-08-28
    • 文件大小:2097152
    • 提供者:zj1120
  1. hadoop部署文档

  2. Linux虚机手工安装Apache Hadoop的步骤。这个安装只有HDFS、YARN、MapReduce等基本组件,不包含任何其他的Hadoop组件。如果需要使用Hive、HBase、Spark等其他工具,需要在此基础上手工安装
  3. 所属分类:Hadoop

    • 发布日期:2018-10-30
    • 文件大小:93184
    • 提供者:xusp977
  1. 08-Hadoop-HA.pdf

  2. Hadoop-HA思维导图,便捷整理思路,实操Hadoop-HA、ResourceManager-HA、Yarn、RS-HA故障转移
  3. 所属分类:Hadoop

    • 发布日期:2020-02-09
    • 文件大小:2097152
    • 提供者:weixin_43555997
  1. Hadoop与Spark 肖睿+PDF

  2. 大数据技术让我们以一种靠前的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,很终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core、Spark SQL、Spark Streaming等知识。本书
  3. 所属分类:其它

    • 发布日期:2019-08-18
    • 文件大小:171966464
    • 提供者:ermaoermao
  1. 大数据Hadoop开发基础

  2. 从理论着手介绍Hadoop的概念、Hadoop的特点,了解Hadoop的主要思想和发展历程;再通过介绍Hadoop的HDFS、MapReduce和YARN三大主要的核心框架,深入地了解Hadoop的整体架构,掌握Hadoop核心架构HDFS和MapReduce;并对Hadoop框架中的其他组件和应用场景进行概要性介绍。
  3. 所属分类:Hadoop

    • 发布日期:2020-09-26
    • 文件大小:52224
    • 提供者:RomanRakens
  1. hadoop相关配置文件.zip

  2. Hadoop配置文件,包括core-site.xml、hadoop-evn.sh、hdfs-site.xml、map-red.xml、yarn-site.xml等配置文件各个选项及对应的功能配置
  3. 所属分类:其它

    • 发布日期:2020-10-10
    • 文件大小:135168
    • 提供者:Agoni_xiao
  1. 一、Hadoop简介 和 Hadoop结构介绍

  2. 1、Hadoop 是什么 Hadoop是现阶段数据开发的基础,Hadoop通常是指一个更广泛的概念—-Hadoop生态圈(基于或关于Hadoop的大数据开发的各种软件环境) 是Apache公司使用Java语言编写的开源的,分布式系统的基础架构 分布式就是,当储存数据很多很大时,一台机器储存不了时,需要将数据切成块,使用多台计算机分布式储存这些数据。 由于专业的大数据的服务器比较昂贵,Hadoop解决了,在计算机级别服务器上的,大规模数据的存储和分析计算 Hadoop 官网 2、Hadoop 组成
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:476160
    • 提供者:weixin_38632006
  1. 美团1万台 Hadoop 集群 YARN 的调优之路

  2. 背景 YARN作为Hadoop的资源管理系统,负责Hadoop集群上计算资源的管理和作业调度。 美团的YARN以社区2.7.1版本为基础构建分支。目前在YARN上支撑离线业务、实时业务以及机器学习业务。 离线业务主要运行的是Hive on MapReduce, Spark SQL为主的数据仓库作业。 实时业务主要运行Spark Streaming,Flink为主的实时流计算作业。 机器学习业务主要运行TensorFlow,MXNet,MLX(美团点评自研的大规模机器学习系统)等计算作业。 YA
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:747520
    • 提供者:weixin_38689113
  1. Hadoop各组件详解(HDFS篇)

  2. 一、Hadoop三大组件 1.HDFS 分布式文件存储系统 2.MapReduce 分布式离线计算框架 ​3.Yarn Hadoop资源调度器 1.HDFS HDFS的设计特点是: 1、大数据文件,非常适合上T级别的大文件或者一堆大数据文件的存储,如果文件只有几个G甚至更小就没啥意思了 2、文件分块存储,HDFS会将一个完整的大文件平均分块存储到不同计算器上, 它的意义在于读取文件时可以同时从多个主机取不同区块的文件,多主机读取比单主机读取效率要高得多得都。 3、流式数据访问,一次写入多
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:749568
    • 提供者:weixin_38609693
  1. 拥抱大数据——初识Hadoop,轻松应对海量数据存储与分析所带来的挑战

  2. 目录 一、前言:什么是Hadoop? 二、Hadoop生态圈 2.1 Hadoop2.x的生态系统 2.2 Hadoop2.x各个组件 2.3 大数据与云计算 三、HDFS(分布式文件系统) 3.1 hdfs架构 3.2 hdfs存储 四、MapReduce(分布式计算框架) 4.1 Map+Reduce 4.2 MapReduce架构 4.3 MapReduce数据处理 4.3.1 job与task 4.3.2 MapReduce数据处理 五、YARN(资源管理系统) 5.1 YARN架构 六
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:909312
    • 提供者:weixin_38649838
« 12 3 4 5 6 »