您好,欢迎光临本网站![请登录][注册会员]  
文件名称: 阿里Hadoop集群架构及服务体系.PDF
  所属分类: 平台管理
  开发工具:
  文件大小: 1mb
  下载次数: 0
  上传时间: 2019-08-03
  提 供 者: linu*****
 详细说明:阿里Hadoop集群架构及服务体系集群发展现状规模 3000 3000 2500 2000 2000 1500 1000 ■集群规模(台) 1000 700 500 200 0 200942010.32010.72012.12012.10 上线集群迁 Oracle rac基服务扩展 移机房本迁移完成至全集团 迎战1111 Alibaba confidentia 集群发展现状容量与负载 集群容量 集群负载 约3200台服务器 每天Job数150,000+道 物理CPU30000核 每天 hive query数6,000 内存"100TB 每天扫描数据量7.5PB 磁盘36000块 每天扫描文件数4亿 存储利用率80% 存储容量60PB CPU利用率65%峰值80% Alibaba confidentia 集群发展现状业务 150+集群用户组 4,500+集群用户 淘 淘宝 阿里的“水电煤”服务 聚划算 天猫 CBU 支付宝 HDES 云梯 Hadoop集群 Alibaba confiden 集群服务模式分组管理 Name Quota f/group/taobao-dev /group/tmall-dev Space Quota 按需申请 业务方: 淘宝测试 计费 按需申请 cug-taobao-dev min/maxSlots cug-tmall-dev real slots Alibaba confidentia 集群服务模式数据共享 原始表/中间表/元数据共享 避免重复计算和存储 “阿里巴巴数据交换中心” 淘宝 交易表 淘 天猫 评价表 支付宝 成交表 Alibaba confidentia 集群服务模式集群共享 生产\开发\测试\预发共享一个集群 重点生产业务09点运行 非生产限制在923点可用 测试」「预发 避免数据在不同集群间拖动 开发 9~23点 9~23 点 9~23点 HDFS 全天可用 云梯 Hadoop集群 Alibaba confidentia 集群服务模式生态系统 Hive 基于 Mapreduce的SQL引擎 Streaming可以用任意可执行程序运行 Mapreduce Mahout机器学习算法库 Pig 类似于 cHive的大规模数据分析工具 HBase 准在线存储服务 Alibaba confidentia 集群服务模式优势 自建 Hadoop 集群 共用 Hadoop集群 集群搭建机器采购,机房布局 不用考虑 集群运维节点宕机后需要立即介入不用考虑 集群扩计算或存储资源不足,需网页申请,审批通过即 要扩容,采购新的机器可生效 代码维护 adop代码维护,专业的 Hadoop 开发人员 不用考虑 数据复使用其他团队数据,需要集团大部分数据集中在 从另外集群复制过来 起 成本1168台 2861台 Alibaba confidentia
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: