您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Hive中SQL详解

  2. Hive中SQL详解
  3. 所属分类:Hive

    • 发布日期:2017-07-17
    • 文件大小:51200
    • 提供者:xueshan666
  1. HIVE安装及详解

  2. HIVE安装及详解,及测试,该文档版本是1.2+的。。。。。
  3. 所属分类:Hive

    • 发布日期:2018-10-14
    • 文件大小:1048576
    • 提供者:u011410254
  1. 大数据处理hive深入详解.pdf

  2. Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。
  3. 所属分类:Hive

    • 发布日期:2020-03-27
    • 文件大小:886784
    • 提供者:qq_32146369
  1. 11_离线计算系统_第11天(HIVE详解)v.2.docx

  2. 11_离线计算系统_第11天(HIVE详解)v.2 学习必备;1、熟练掌握hive的使用 2、熟练掌握hql的编写 3、理解hive的工作原理 4、具备hive应用实战能力
  3. 所属分类:其它

    • 发布日期:2020-03-06
    • 文件大小:1048576
    • 提供者:rgbvfhpyygy
  1. 详解hbase与hive数据同步

  2. 主要介绍了详解hbase与hive数据同步的相关资料,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-08-29
    • 文件大小:182272
    • 提供者:weixin_38534444
  1. Mysql元数据如何生成Hive建表语句注释脚本详解

  2. 主要给大家介绍了关于Mysql元数据如何生成Hive建表语句注释脚本的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面跟着小编来一起学习学习吧。
  3. 所属分类:其它

    • 发布日期:2020-09-09
    • 文件大小:41984
    • 提供者:weixin_38723691
  1. yum安装CDH5.5 hive、impala的过程详解

  2. 主要介绍了yum安装CDH5.5 hive、impala的过程详解的相关资料,非常不错 具有一定的参考借鉴价值,需要的朋友可以参考下
  3. 所属分类:其它

    • 发布日期:2020-09-15
    • 文件大小:80896
    • 提供者:weixin_38629274
  1. Hive视频教程详解及实战.rar

  2. Hive视频教程详解及实战视频教程,课程由浅入深,介绍了Hive基本架构及环境部署,带领大家认识数据仓库Hive的优势及Hive具体使用。并通过企业实际需求分析,讲解HiveQL中的DDL和DML的使用,以及常见的性能优化方案。
  3. 所属分类:Hive

    • 发布日期:2020-12-05
    • 文件大小:273
    • 提供者:u011552756
  1. pandas dataframe 中的explode函数用法详解

  2. 在使用 pandas 进行数据分析的过程中,我们常常会遇到将一行数据展开成多行的需求,多么希望能有一个类似于 hive sql 中的 explode 函数。 这个函数如下: Code # !/usr/bin/env python # -*- coding:utf-8 -*- # create on 18/4/13 import pandas as pd def dataframe_explode(dataframe, fieldname): temp_fieldname = fieldnam
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:39936
    • 提供者:weixin_38726193
  1. Hadoop各组件详解(Hive篇)

  2. 一、Hive简介 1.什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL); 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,hive可以理解为一个将SQL转换为MapReduce的任务的工具 2.Hive的特点 可扩展 Hive可以自由的扩展集群的规模,一般情况下不需要重启服务 延展性 Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数 容错
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:156672
    • 提供者:weixin_38707153
  1. Flume详解与安装部署教程

  2. 1、Flume概述 在一个完整的离线大数据处理系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架。 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统 Flume支持在日志系统中定制各类数据发送方,用于收集数据; Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 2. Flume的架构(
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:218112
    • 提供者:weixin_38642897
  1. Spark RDD详解

  2. 常见疑问 Spark与Apache Hadoop有何关系? Spark是与Hadoop数据兼容的快速通用处理引擎。它可以通过YARN或Spark的Standalone在Hadoop集群中运行,并且可以处理HDFS、Hbase、Cassandra、Hive和任何Hadoop InputFormat中的数据。它旨在执行批处理(类似于MapReduce)和提供新的工作特性,例如流计算,SparkSQL交互式查询和Machine Learning机器学习等。 我的数据需要容纳在内存中才能使用Spark吗
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:166912
    • 提供者:weixin_38677806
  1. 详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive

  2. 通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:286720
    • 提供者:weixin_38745361
  1. 知识分享:详解Hadoop核心架构

  2. 通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:367616
    • 提供者:weixin_38508549
  1. Impala和Hive的关系(详解)

  2. Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。Impala与Hive都是构建在Hadoop之上的数据查询工具各有不同的侧重适应面,但从客户端使用来看Impala与Hive有很多的共同之处,如数据表元数据、ODBC/JDBC驱动、SQL语法、灵活的文件格式、存储资源池等。Impala与Hi
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:425984
    • 提供者:weixin_38722164
  1. 大数据私房菜_Hive详解(2021)

  2. pdf密码 dsjsfc Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
  3. 所属分类:Hive

    • 发布日期:2021-02-22
    • 文件大小:2097152
    • 提供者:qq_38200425
  1. 知识分享:详解Hadoop核心架构

  2. 通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:367616
    • 提供者:weixin_38535428
  1. HadoopHivesql语法详解

  2. Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需要的内容,这套SQL简称HiveSQL,使不熟悉mapreduce的用户很方便的利用SQL
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:92160
    • 提供者:weixin_38694336
  1. 详解Hadoop核心架构HDFS+MapReduce+Hbase+Hive

  2. 通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内部具体实现。如有不足,后续及时修改。整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:286720
    • 提供者:weixin_38744902
  1. Spark计算引擎之SparkSQL详解

  2. 1.SparkSQL概述 1.1.SparkSQL的前世今生 Shark是一个为Spark设计的大规模数据仓库系统,它与Hive兼容。Shark建立在Hive的代码基础上,并通过将Hive的部分物理执行计划交换出来。这个方法使得Shark的用户可以加速Hive的查询,但是Shark继承了Hive的大且复杂的代码使得Shark很难优化和维护,同时Shark依赖于Spark的版本。随着我们遇到了性能优化的上限,以及集
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:741376
    • 提供者:weixin_38705762
« 12 3 »