您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hive编程PDF

  2. 《Hive编程指南》是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。
  3. 所属分类:其它

    • 发布日期:2015-05-20
    • 文件大小:27262976
    • 提供者:minruidu1
  1. apache-hive文档

  2. ApacheHive文档!
  3. 所属分类:Java

    • 发布日期:2016-09-10
    • 文件大小:35651584
    • 提供者:tiechui1994
  1. hive,阿帕奇蜂巢.zip

  2. ApacheHive(TM)数据仓库软件有助于阅读,
  3. 所属分类:其它

    • 发布日期:2019-09-25
    • 文件大小:47185920
    • 提供者:weixin_38744375
  1. hive,阿帕奇蜂巢.zip

  2. ApacheHive(TM)数据仓库软件有助于阅读,
  3. 所属分类:其它

    • 发布日期:2019-09-25
    • 文件大小:47185920
    • 提供者:weixin_38744207
  1. hive,阿帕奇蜂巢.zip

  2. ApacheHive(TM)数据仓库软件有助于阅读,
  3. 所属分类:其它

    • 发布日期:2019-10-11
    • 文件大小:47185920
    • 提供者:weixin_38743506
  1. Apache Hive 中文手册.docx

  2. hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。
  3. 所属分类:Hive

    • 发布日期:2020-04-09
    • 文件大小:610304
    • 提供者:weixin_30777913
  1. Apache hive常用函数.zip

  2. apache hive函数,比较全面;包括关系运算,数学运算,逻辑运算,数值运算,日期函数,条件函数
  3. 所属分类:互联网

    • 发布日期:2020-07-27
    • 文件大小:581632
    • 提供者:sudaxhh
  1. phpHiveAdmin:Apache Hive管理系统-源码

  2. php版本已被弃用,新的​​python版本即将推出 phpHiveAdmin 这是用PHP编写的HIVE(apache)管理和查询工具 它可以像phpMyAdmin一样简单地使用 程序开发环境: CentOS 5.4 Hadoop-0.20.203.0 Hive 0.7.1 PHP 5.3.8 Apache 2.2.x 测试在以下环境下通过:centos 5.x-6.x ubuntu 11.x-12.x Hadoop 0.20.x-1.xx Hive 0.6.x-0.9.x php 5.
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:1048576
    • 提供者:weixin_42173218
  1. bigdata:Apache Hive,Spark相关-源码

  2. 程式设计 配置目标: Hive on Mr-Apache Ignite缓存 通过LLAP缓存(TODO)在MR上进行配置 在Tez上蜂巢 通过LLAP缓存(TODO)在Tez上进行配置 Spark SQL-具有HDFS的Spark独立集群 依存关系: 阿帕奇蜂巢 元商店: 蜂巢-> /data/hdfs/apache-hive-2.3.3-bin hadoop-> /data/hdfs/hadoop-2.9.0 HiveServer2: 必须具有可用的元
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:254976
    • 提供者:weixin_42103587
  1. Python学习笔记——大数据之Spark简介与环境搭建

  2. Spark是Apache顶级项目里面最火的大数据处理的计算引擎,它目前是负责大数据计算的工作。包括离线计算或交互式查询、数据挖掘算法、流式计算以及图计算等。核心组件如下:SparkCore:包含Spark的基本功能;尤其是定义RDD的API、操作以及这两者上的动作。其他Spark的库都是构建在RDD和SparkCore之上的。SparkSQL:提供通过ApacheHive的SQL变体Hive查询语言(HiveQL)与Spark进行交互的API。每个数据库表被当做一个RDD,SparkSQL查询被
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:570368
    • 提供者:weixin_38643401
  1. 网易杭研大数据实践:ApacheHive稳定性测试

  2. Hive是Apache开源的数据仓库工具,主要是将基于Hadoop的结构化数据文件映射为数据库表,并提供类SQL查询功能。Hive最初的目标是为了降低大数据开发的门槛,它屏蔽了底层计算模型的复杂开发逻辑,类SQL的查询功能也便于数据应用的开发,但Hive并不适合哪些低延迟的查询服务,如联机事务处理(OLTP)类查询,主要用于离线数据分析,数据量一般都巨大,一般会有分钟级的查询延迟。随着大数据的发展,Hive衍生出了基于Thrift的RPC服务Hiveserver2、Metastore,便于进行规
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:248832
    • 提供者:weixin_38519387
  1. ApacheHive

  2. ApacheHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供一种HQL语言进行查询,具有扩展性好、延展性好、高容错等特点,多应用于离线数仓建设。存储:Hive底层存储依赖于hdfs,因此也支持hdfs所支持的数据存储格式,如text、json、parquet等。当我们将一个文件映射为Hive中一张表时,只需在建表的时告诉Hive,数据中的列名、列分隔符、行分隔符等,Hive就可以自动解析数据。支持多种压缩格式:bzip2、gzip、lzo、snapp
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:435200
    • 提供者:weixin_38729685
  1. Hive-JSON-Serde:读取-为Apache Hive编写JSON SerDe-源码

  2. JsonSerde-JSON数据的读/写SerDe 建立状态: 掌握 : 开发: 该库使Apache Hive能够以JSON格式进行读写。 它包括对序列化和反序列化(SerDe)以及JSON转换UDF的支持。 特征 读取以JSON格式存储的数据 在INSERT INTO 期间将数据转换为JSON格式 支持JSON数组和映射 支持嵌套数据结构 支持Cloudera发行版,包括Apache Hadoop(CDH) 支持多种版本的Hadoop 安装 下载最新的二进制文件( json-serd
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:157696
    • 提供者:weixin_42133969
  1. docs4dev:包含基本系列文档(Spring,Spring Boot,Spring Cloud,Spring Security,Spring Session),大数据(Apache Hive,HBase,Apache Flume),日志

  2. docs4dev:包含基本系列文档(Spring,Spring Boot,Spring Cloud,Spring Security,Spring Session),大数据(Apache Hive,HBase,Apache Flume),日志(Log4j2,Logback) ,Http Server(NGINX,Apache),Python,数据库(OpenTSDB,MySQL,PostgreSQL)等最新官方文档以及对应的英文翻译
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42099302
  1. hive-bigquery-storage-handler:用于BigQuery和Apache Hive之间互操作性的Hive存储处理程序-源码

  2. Hive-BigQuery StorageHandler 这是一个Hive StorageHandler插件,可让Hive与BigQuery进行交互。 它允许您保留现有管道,但可以迁移到BigQuery。 它利用高吞吐量读取数据,并使用BigQuery API写入数据。 在Google Cloud Platform的Dataproc集群下执行以下步骤。 如果您需要在集群中运行,则需要为Hadoop设置Google Cloud SDK和Google Cloud Storage连接器。 获取St
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:35840
    • 提供者:weixin_42123191
  1. 网易杭研大数据实践:Apache Hive稳定性测试

  2. Hive是Apache开源的数据仓库工具,主要是将基于Hadoop的结构化数据文件映射为数据库表,并提供类SQL查询功能。Hive最初的目标是为了降低大数据开发的门槛,它屏蔽了底层计算模型的复杂开发逻辑,类SQL的查询功能也便于数据应用的开发,但Hive并不适合哪些低延迟的查询服务,如联机事务处理(OLTP)类查询,主要用于离线数据分析,数据量一般都巨大,一般会有分钟级的查询延迟。
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:249856
    • 提供者:weixin_38677260
  1. Apache Hive

  2. Apache Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供一种HQL语言进行查询,具有扩展性好、延展性好、高容错等特点,多应用于离线数仓建设。
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:440320
    • 提供者:weixin_38701312