您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. HIVE优化实战分享

  2. HIVE优化实战分享 大数据存储方案 很好的参考文档
  3. 所属分类:其它

    • 发布日期:2014-03-14
    • 文件大小:974848
    • 提供者:yesky_zhang
  1. HIVE优化实战分享

  2. HIVE优化实战分享 HIVE优化实战分享 HIVE优化实战分享
  3. 所属分类:其它

    • 发布日期:2017-12-12
    • 文件大小:974848
    • 提供者:wzgv007
  1. SparkSql和DataFrame实战.docx

  2. 文档主要介绍了环境搭建和配置使用 1. 什么是Spark SQL Spark SQL的一个用途是执行使用基本SQL语法或HiveQL编写的SQL查询。Spark SQL还可以用于从现有的Hive安装中读取数据。有关如何配置此功能的更多信息,请参考Hive表格部分。当从另一种编程语言中运行SQL时,结果将作为DataFrame返回。您还可以使用命令行或jdbc/odbc来与SQL接口进行交互。 2. 什么是DataFrame 一个以命名列组织的分布式数据集。概念上相当于关系数据库中一张表或在R
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:929792
    • 提供者:weixin_42349399
  1. Spark实战.docx

  2. 1. Spark是特性  高可伸缩性  高容错  于内存计算 2. Spark的生态体系(BDAS,中文:伯利克分析栈)  MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一  Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等  BDAS包含了Spark、Shark(相当于Hive)、BlinkDB、Spark Streaming(消息实时处理框架,类似Storm)等等 3. Spark
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:508928
    • 提供者:weixin_42349399
  1. 基于Hadoop离线大数据分析平台项目实战

  2. 课程简介: 某购物电商网站数据分析平台,分为收集数据、数据分析和数据展示三大层面。其中数据分析主要依据大数据Hadoop生态系统常用组件进行处理,此项目真实的展现了大数据在企业中实际应用。 课程内容 (1)文件收集框架 Flume ①Flume 设计架构、原理(三大组件) ②Flume 初步使用,实时采集数据 ③实际案例:使用Flume监控数据,实时收集存储HDFS中 (2)大数据分析平台架构 ①数据平台三大模块 让技术产生价值! ②分析平台业务数据 ③大数据平台技术选型和搭建配置测试 (3)
  3. 所属分类:Hadoop

    • 发布日期:2018-07-03
    • 文件大小:889
    • 提供者:kaipuledou
  1. 《企业级Hive实战课程》大纲

  2. 作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成,如我所在的电商。 Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重要。 Hive作业的规模决定着优化层级,一个Hive作业的优化和一万的Hive作业的优化截然不同。 拥有1万多个Hive作业的大电商如何进行Hive优化的?本系列课结合企业实战和场景从作业架构层面、Hql(Hive sql)语法层面、Hive参数层面依次讲述。
  3. 所属分类:Hive

    • 发布日期:2018-09-25
    • 文件大小:518144
    • 提供者:xly520
  1. hive优化案例

  2. 作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由Hive完成,如我所在的电商。 Hive在企业云计算平台发挥的作用和影响愈来愈大,如何优化提速已经显得至关重要。 Hive作业的规模决定着优化层级,一个Hive作业的优化和一万的Hive作业的优化截然不同。 拥有1万多个Hive作业的大电商如何进行Hive优化的?本系列课结合企业实战和场景从作业架构层面、Hql(Hive sql)语法层面、Hive参数层面依次讲述。
  3. 所属分类:Hive

    • 发布日期:2019-01-14
    • 文件大小:20971520
    • 提供者:weixin_43368548
  1. 大数据从破冰到精进

  2. HIVE表、实战课程,课件、数据、脚本模板,基本数据类型、复杂实战、查询优化等
  3. 所属分类:Hive

    • 发布日期:2019-03-21
    • 文件大小:60817408
    • 提供者:fxwlily
  1. Hive视频教程详解及实战.rar

  2. Hive视频教程详解及实战视频教程,课程由浅入深,介绍了Hive基本架构及环境部署,带领大家认识数据仓库Hive的优势及Hive具体使用。并通过企业实际需求分析,讲解HiveQL中的DDL和DML的使用,以及常见的性能优化方案。
  3. 所属分类:Hive

    • 发布日期:2020-12-05
    • 文件大小:273
    • 提供者:u011552756
  1. hive自定义udf函数实战

  2. 一、UDF相关概念 udf函数,用户自定义函数,可以直接在sql语句中计算的函数 优点: 允许实现模块化的程序设计、方便修改代码、增加函数 UDF的执行速度很快,通过缓存计划在语句重复执行时降低代码的编译开销,比存储方法的执行效率更高 可用于减少网络流量 UDF放入内存中,设计不当可能导致系统的崩溃,所以必须在必要的时候实施优化,对udf的优化是通过改写原来的udf代码实现,主要包括两种场景 如果udf嵌套复杂,可以重写一个嵌套层数较少且可以实现相同功能的udf,使性能成倍提升 针对过滤类
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:52224
    • 提供者:weixin_38506835
  1. 大数据开发实战:SparkStreaming流计算开发

  2. Storm以及离线数据平台的MapReduce和Hive构成了Hadoop生态对实时和离线数据处理的一套完整处理解决方案。除了此套解决方案之外,还有一种非常流行的而且完整的离线和实时数据处理方案。这种方案就是Spark。Spark本质上是对Hadoop特别是MapReduce的补充、优化和完善,尤其是数据处理速度、易用性、迭代计算和复杂数据分析等方面。SparkStreaming作为Spark整体解决方案中实时数据处理部分,本质上仍然是基于Spark的弹性分布式数据集(ResilientDist
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:222208
    • 提供者:weixin_38684328
  1. 大数据开发实战:SparkStreaming流计算开发

  2. Storm以及离线数据平台的MapReduce和Hive构成了Hadoop生态对实时和离线数据处理的一套完整处理解决方案。除了此套解决方案之外,还有一种非常流行的而且完整的离线和实时数据处理方案。这种方案就是Spark。Spark本质上是对Hadoop特别是MapReduce的补充、优化和完善,尤其是数据处理速度、易用性、迭代计算和复杂数据分析等方面。SparkStreaming作为Spark整体解决方案中实时数据处理部分,本质上仍然是基于Spark的弹性分布式数据集(Resilient Dis
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:221184
    • 提供者:weixin_38732811