您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hadoop入门学习教程 之10.Hive工作原理和基本使用

  2. hadoop入门学习教程 之10.Hive工作原理和基本使用,出自《Cloudera Hadoop 4 实战课程》,hadoop入门学习教程用到技术:CDH4,Cloudera Manager,Hive,HBase,Sqoop, Hadoop培训视频教程涉及项目:电商业日志流量分析项目。
  3. 所属分类:Java

    • 发布日期:2014-07-30
    • 文件大小:49283072
    • 提供者:u013802231
  1. 开源力量——数据挖掘原理与实战

  2. 整套大数据课程从hadoop入门开始,由浅入深,内置“hadoop源码解析与企业应用开发实战”,“Hive开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”,“数据挖掘基础。这个系列课程有几个板块组成,所以学员可以按照自己的实际情况选择学习。例如,对于只需要了解hadoop基本编程的人,只需要选择“hadoop源码解析与企业应用开发实战”模块就可以了;对于立志于从事大数据领域的零起点人员,可以选择四个板块依次学习;对于已经有一定基础的hado
  3. 所属分类:Java

  1. 第14章 基于Hadoop的数据仓库Hive

  2. 本章首先介绍了数据仓库的概念、Hive的基本特征、与其他组件之间的关系、与传统数据库的区别以及它在企业中的具体应用;接着详细介绍了Hive的系统架构,包括基本组成模块、工作原理和几种外部访问方式,描述了Hive的具体应用及Hive HA原理;同时,介绍了新一代开源大数据分析引擎Impala及其与Hive的比较分析;最后,以单词统计为例,介绍了如何使用Hive进行简单编程,并说明了Hive编程相对于MapReduce编程的优势。
  3. 所属分类:讲义

    • 发布日期:2016-04-26
    • 文件大小:1048576
    • 提供者:qq97294972
  1. hive的原理分析

  2. 这里详细的介绍了hive的原理,形象的分析了hive的原理,流程
  3. 所属分类:Hive

    • 发布日期:2018-03-30
    • 文件大小:55296
    • 提供者:dengddddw
  1. 深入理解Spark 核心思想与源码分析

  2. 深入理解Spark 核心思想与源码分析 ,耿嘉安完整版,大数据spark开发必备,你值得拥有。清晰完整版 《深入理解SPARK:核心思想与源码分析》结合大量图和示例,对Spark的架构、部署模式和工作模块的设计理念、实现源码与使用技巧进行了深入的剖析与解读。, 《深入理解SPARK:核心思想与源码分析》一书对Spark1.2.0版本的源代码进行了全面而深入的分析,旨在为Spark的优化、定制和扩展提供原理性的指导。阿里巴巴集团专家鼎力推荐、阿里巴巴资深Java开发和大数据专家撰写。, 本书分为
  3. 所属分类:spark

    • 发布日期:2018-05-22
    • 文件大小:39845888
    • 提供者:jyh2005
  1. Hive 简明教程.pdf

  2. Hive 简明教程 第一部分:完全以日常使用为目标,整理了常用的Hive 语法,而抛弃了不常用的部分,用来 满足不懂技术的分析人员来快速使用Hive 进行常见的日常数据分析。 第二部分:如果想能写出高效的Hive 语句,必须要先了解Hive 执行原理,然后掌握一系列 的优化方法。所以第二部分主要内容是Hive 原理与优化。 第三部分:讲解Hive 的一系列技术细节,以满足技术人员想了解技术细节的要求,为能更加 高效和灵活地使用Hive 提供技术基础
  3. 所属分类:Hive

    • 发布日期:2018-06-21
    • 文件大小:3145728
    • 提供者:dayu0007
  1. 基于Hadoop离线大数据分析平台项目实战

  2. 课程简介: 某购物电商网站数据分析平台,分为收集数据、数据分析和数据展示三大层面。其中数据分析主要依据大数据Hadoop生态系统常用组件进行处理,此项目真实的展现了大数据在企业中实际应用。 课程内容 (1)文件收集框架 Flume ①Flume 设计架构、原理(三大组件) ②Flume 初步使用,实时采集数据 ③实际案例:使用Flume监控数据,实时收集存储HDFS中 (2)大数据分析平台架构 ①数据平台三大模块 让技术产生价值! ②分析平台业务数据 ③大数据平台技术选型和搭建配置测试 (3)
  3. 所属分类:Hadoop

    • 发布日期:2018-07-03
    • 文件大小:889
    • 提供者:kaipuledou
  1. 深入理解Spark 核心思想与源码分析

  2. 在深入了解一个系统的原理、实现细节之前,应当先准备好它的源码编译环境、运行环境。如果能在实际环境安装和运行Spark,显然能够提升读者对于Spark的一些感受,对系统能有个大体的印象,有经验的技术人员甚至能够猜出一些Spark采用的编程模型、部署模式等。当你通过一些途径知道了系统的原理之后,难道不会问问自己?这是怎么做到的。如果只是游走于系统使用、原理了解的层面,是永远不可能真正理解整个系统的。很多IDE本身带有调试的功能,每当你阅读源码,陷入重围时,调试能让我们更加理解运行期的系统。如果没有
  3. 所属分类:spark

    • 发布日期:2018-10-06
    • 文件大小:42991616
    • 提供者:kuigoutang2400
  1. mrdear.cn Nginx相关日志

  2. mrdear.cn该网站的nginx相关日志,用于《从Nginx日志分析学习Hive原理》相关系列文章源数据。
  3. 所属分类:数据库

    • 发布日期:2018-10-13
    • 文件大小:187695104
    • 提供者:u012706811
  1. 2017最新大数据架构师精英课程

  2. 本资源为大数据基础到中高级教学资源,适合稍微有点大数据或者java基础的人群学习,资源过大,上传乃是下载链接,不多说,上目录: 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
  3. 所属分类:Java

  1. 9_大数据分析之hive学习.zip

  2. 大数据分析环境安装与设置,大数据分析课程,hadoop原理,hive操作,函数,Hadoop原理与概念,HQL核心技能1--常用函数--表连接
  3. 所属分类:互联网

    • 发布日期:2020-05-24
    • 文件大小:32505856
    • 提供者:wang880117
  1. 新闻日志大数据分析及可视化系统的设计与实现.doc

  2. 每天都有着大量的用户关注各类新闻,特别是随着各种网络通信技术的发展,网络应用的普及使得每时每刻都有着大量的人们通过网络进行各类新闻的搜索,产生海量的日志数据。过去使用单机的方式通过 MySQL数据库对这些数据进行存储,但是积累下来的用户日志数据量达到了一定的级别,当一台电脑无法存储这么庞大的数据时,就产生了海量数据的存储问题。如果使用网络文件系统对数据进行分开存储,那么就无法对大量的实时和离线数据进行分析处理,处理结果也无法以一种更加直观的方式进行展示。 为了解决海量新闻日志数据的存储问题,在新
  3. 所属分类:互联网

    • 发布日期:2020-08-15
    • 文件大小:2097152
    • 提供者:beans9
  1. Hive技术原理

  2. 数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。无法满足快速增长的海量数据存储需求。无法有效处理不同类型的数据。计算和处理能力不足。Hive是一个构建于Hadoop顶层的数据仓库工具,可以查询和管理PB级别的分布式数据。支持大规模数据存储、分析,具有良好的可扩展性某种程度上可以看作是用户编程接口,本身不存储和处理数据
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:664576
    • 提供者:weixin_38536349
  1. Presto架构及原理

  2. Presto是Facebook推出的一个基于Java开发的大数据分布式SQL查询引擎,可对从数G到数P的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别,据称该引擎的性能是Hive的10倍以上。Presto可以查询包括Hive、Cassandra甚至是一些商业的数据存储产品,单个Presto查询可合并来自多个数据源的数据进行统一分析。Presto的目标是在可期望的响应时间内返回查询结果,Facebook在内部多个数据存储中使用Presto交互式查询,包括300PB的数据仓库,超过1000
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:393216
    • 提供者:weixin_38647567
  1. impala的原理架构介绍及应用场景

  2. 由cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS和Hbase中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点。1.查询速度快。Impala不同于hive,hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程。不同于hive,impala
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:328704
    • 提供者:weixin_38626943
  1. Hive原理分析

  2. 本文来自知乎,由火龙果软件Anna编辑、推荐。在开始了解hive之前,需要了解一些知识或者概念,可以更好的理解hive实现原理GoogleMapReduce是Google基于函数式编程map(映射),reduce(化简)提出的一种分布式编程模型,在模型中隐藏了分布式集群的实现细节,交由框架底层进行实现,能够使程序员在不了解分布式并行编程的情况下,将自己书写的程序在分布式系统上运行Map:将输入的一对键值对转换为一组中间键值对(k1,v1)->list(k2,v2)Reduce:将所有键相同
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:508928
    • 提供者:weixin_38589314
  1. Presto架构及原理

  2. Presto是Facebook推出的一个基于Java开发的大数据分布式 SQL查询引擎,可对从数G到数P的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别,据称该引擎的性能是 Hive的10倍以上。Presto可以查询包括Hive、Cassandra甚至是一些商业的数据存储产品,单个 Presto查询可合并来自多个数据源的数据进行统一分析。Presto的目标是在可期望的响应时间
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:393216
    • 提供者:weixin_38678300
  1. impala的原理架构介绍及应用场景

  2. 由cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS和Hbase中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点。1.查询速度快。Impala不同于hive,hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程。不同于hive,impala
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:328704
    • 提供者:weixin_38713393
  1. Hive原理分析

  2. 本文来自知乎,由火龙果软件Anna编辑、推荐。 在开始了解hive之前,需要了解一些知识或者概念,可以更好的理解hive实现原理 GoogleMapReduce是Google基于函数式编程map(映射),reduce(化简)提出的一种分布式编程模型,在模型中隐藏了分布式集群的实现细节,交由框架底层进行实现,能够使程序员在不了解分布式并行编程的情况下,将自己书写的程序在分布式系统上运行
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:508928
    • 提供者:weixin_38704485
  1. Zeppelin原理简介

  2. Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。后台支持接入多种数据处理引擎,如spark,hive等。支持多种语言: Scala(ApacheSpark)、Python(ApacheSpark)、SparkSQL、 Hive、Markdown、Shell等。本文主要介绍Zeppelin中Interpreter和SparkInterpreter的实现原理。Zeppelin中最核心的概念是Interpreter,interpreter是一个插
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:76800
    • 提供者:weixin_38685173
« 12 »