您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Apache Hadoop---Sqoop.docx

  2. Sqoop是SQL-to-Hadoop的缩写,是Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换。Sqoop可以将一个关系型数据库(例如MySQL、Oracle、PostgreSQL等)中的数据导入Hadoop的HDFS、Hive中,也可以将HDFS、Hive中的数据导入关系型数据库中。Sqoop充分利用了Hadoop的优点,整个数据导入导出过程都是用MapReduce实现并行化,同时,该过程中的大部分步骤自动执行,非常方便。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:1048576
    • 提供者:qq_31641743
  1. Apache Hadoop---Sentry.docx

  2. Apache Sentry是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户的管理模式。Sentry当前可以和Hive/Hcatalog、Apache Solr 和Cloudera Impala集成,未来会扩展到其他的Hadoop组件,例如HDFS和HBase。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:211968
    • 提供者:qq_31641743
  1. Apache Hadoop---Ranger.docx

  2. Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计。它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台,管理员可以轻松的通过配置策略来控制用户访问权限。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:200704
    • 提供者:qq_31641743
  1. Apache Hadoop---Pig.docx

  2. Pig运行在Hadoop上,是对大型数据集进行分析和评估的平台。它简化了使用Hadoop进行数据分析的要求,提供了一个高层次的、面向领域的抽象语言:PigLatin。通过PigLatin,数据工程师可以将复杂且相互关联的数据分析任务编码为Pig操作上的数据流脚本,通过将该脚本转换为MapReduce任务链,在Hadoop上执行。和Hive一样,Pig降低了对大型数据集进行分析和评估的门槛。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-12
    • 文件大小:31744
    • 提供者:qq_31641743
  1. Apache Hadoop---Hive.docx

  2. Hive是Hadoop中的一个重要子项目,最早由Facebook设计,是建立在Hadoop基础上的数据仓库架构,它为数据仓库的管理提供了许多功能,包括:数据ETL(抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。Hive提供的是一种结构化数据的机制,定义了类似于传统关系数据库中的类SQL语言:HiveQL,通过该查询语言,数据分析人员可以很方便地运行数据分析业务(将SQL转化为MapReduce任务在Hadoop上执行)。
  3. 所属分类:Hive

    • 发布日期:2020-06-12
    • 文件大小:133120
    • 提供者:qq_31641743
  1. Apache Hadoop---Crunch.docx

  2. Apache Crunch 是基于 FlumeJava 实现的,它是一个基于 MapReduce 的数据管道库。Apache Crunch是一个 Java 类库,它用于简化 MapReduce 作业的编写和执行,并且可以用于简化连接和数据聚合任务API的Java类库。与 Pig 和 Hive 一样,Crunch 是为了降低 MapReduce 的入门成本。它们的区别是:Pig 是一个基于管道的框架,而 Crunch 则是一个 Java 库,它提供比 Pig 更高级别的灵活性。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:19456
    • 提供者:qq_31641743
  1. Apache Hadoop---Ambari.docx

  2. Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:368640
    • 提供者:qq_31641743