您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 一本适合运维工程师看的刊物

  2. 【IT管理&生活】 1. 给刚玩Hadoop的朊友一些建议 2. 程序员在囧途之做私活小记 【开发技术】 1. 阿里巴巴MySQL DBA面试题答案 2. 【坐在马桶上看算法】:巧妙的邻接表(数组实现) 【网络技术】 1. 基于Web应用的性能分析及优化案例 2. Zabbix企业应用之解决大量的nodata报警通知
  3. 所属分类:其它

    • 发布日期:2014-05-22
    • 文件大小:7340032
    • 提供者:bobohexian
  1. 尚gg大数据项目实战电商数仓系统开发教程.txt

  2. 01_数仓项目介绍.avi4 b4 Q* Q8 Z0 Y) C6 O! w 02_数仓采集_用户行为采集课程介绍.avi8 \7 f3 O. c- {: v# W& V$ Y& b 03_数仓采集_数仓的概念.avi8 Z# X* q/ c; }3 A* [ T 04_数仓采集_项目需求.avi6 B8 n s0 h! M4 X# j! |0 ` 05_数仓采集_项目技术选型.avi8 [% N% W, U# y5 s 06_数仓采集_系统数据流程设计.avi8 N: L Y6 D6 y 07
  3. 所属分类:Hive

  1. Hadoop面试题(四)——YARN

  2. 1、简述hadoop1与hadoop2 的架构异同   1)加入了yarn解决了资源调度的问题。   2)加入了对zookeeper的支持实现比较可靠的高可用。 2、为什么会产生 yarn,它解决了什么问题,有什么优势?   1)Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。   2)Yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序…… 3、HDFS的数据压缩算法?(☆☆☆☆☆)   Had
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:97280
    • 提供者:weixin_38609401
  1. Hadoop面试题(一)

  2. 1、集群的最主要瓶颈   磁盘IO 2、Hadoop运行模式   单机版、伪分布式模式、完全分布式模式 3、Hadoop生态圈的组件并做简要描述   1)Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护,命名服务。   2)Flume:一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。   3)Hbase:是一个分布式的、面向列的开源数据库, 利用Hadoop HDFS作为其存储系统。   4)Hive:基于Hadoop的一个
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:60416
    • 提供者:weixin_38693586
  1. 大数据面试复习(一)之HDFS概况

  2. 目录 HDFS特点概况 HDFS核心组件的职责 HDFS数据流程 HDFS写数据流程 HDFS读数据流程 HDFS高可用 HDFS小文件问题 HDFS特点概况 特点: 廉价 流数据读取(流数据是一组顺序、大量、快速、连续到达的数据序列) 大数据集 跨平台 高延迟:换言之不适合低延迟平台 一次写入,多次读取的文件模型 无法高效存储大量小文件。(每个文件都需要一个元数据) 不支持多用户写入及任意修改文件。 HDFS核心组件的职责 HDFS集群包括,NameNode和DataNode以
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:299008
    • 提供者:weixin_38573171