您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Apache Hadoop---Pig.docx

  2. Pig运行在Hadoop上,是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求,提供了一个高层次的、面向领域的抽象语言:PigLatin。通过PigLatin,数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本,通过将该脚本转换为MapReduce任务链,在Hadoop上执行。和Hive一样,Pig降低了对大型数据集进行分析和评估的门槛。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:31744
    • 提供者:qq_31641743
  1. Apache Hadoop---Crunch.docx

  2. Apache Crunch 是基于 FlumeJava 实现的,它是一个基于 MapReduce 的数据管道库。Apache Crunch是一个 Java 类库,它用于简化 MapReduce 作业的编写和执行,并且可以用于简化连接和数据聚合任务API的Java类库。与 Pig 和 Hive 一样,Crunch 是为了降低 MapReduce 的入门成本。它们的区别是:Pig 是一个基于管道的框架,而 Crunch 则是一个 Java 库,它提供比 Pig 更高级别的灵活性。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:19456
    • 提供者:qq_31641743
  1. Apache Hadoop---Ambari.docx

  2. Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:368640
    • 提供者:qq_31641743