您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SparkSql和DataFrame实战.docx

  2. 文档主要介绍了环境搭建和配置使用 1. 什么是Spark SQL Spark SQL的一个用途是执行使用基本SQL语法或HiveQL编写的SQL查询。Spark SQL还可以用于从现有的Hive安装中读取数据。有关如何配置此功能的更多信息,请参考Hive表格部分。当从另一种编程语言中运行SQL时,结果将作为DataFrame返回。您还可以使用命令行或jdbc/odbc来与SQL接口进行交互。 2. 什么是DataFrame 一个以命名列组织的分布式数据集。概念上相当于关系数据库中一张表或在R
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:929792
    • 提供者:weixin_42349399
  1. Spark实战.docx

  2. 1. Spark是特性  高可伸缩性  高容错  于内存计算 2. Spark的生态体系(BDAS,中文:伯利克分析栈)  MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一  Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等  BDAS包含了Spark、Shark(相当于Hive)、BlinkDB、Spark Streaming(消息实时处理框架,类似Storm)等等 3. Spark
  3. 所属分类:spark

    • 发布日期:2018-06-01
    • 文件大小:508928
    • 提供者:weixin_42349399
  1. hadoop的优化.docx

  2. hadoop学习过程中的调优总结,Mapreduce/hive相关的调优,Linux层面的一些调优,Mr/hive 的调优
  3. 所属分类:Hadoop

    • 发布日期:2019-07-18
    • 文件大小:21504
    • 提供者:weixin_43918652
  1. Hive语法详解.docx (排版清晰,覆盖全面,含目录)

  2. 说明:重新排版的个人版Hive语法(一文在手,hql无忧) Hive语法详解: 内容分9个章节 包括安装及配置; DDL,DML,DQL语法; Hive内置函数及自定义函数; Hive窗口函数及行列转换; Hive注意事项及常见优化; ...
  3. 所属分类:Hive

    • 发布日期:2019-08-27
    • 文件大小:2097152
    • 提供者:thomson617
  1. Hive优化.docx

  2. Join 查找操作的基本原则:应该将条目少的表/子查询放在 Join 操作符的左边。原因 是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将 条目少的表放在左边,可以有效减少发生内存溢出错误的几率。 Join 查找操作中如果存在多个 join,且所有参与 join 的表中其参与 join 的 key 都相 同,则会将所有的 join 合并到一个 mapred 程序中。
  3. 所属分类:Hive

    • 发布日期:2019-07-01
    • 文件大小:83968
    • 提供者:love284969214
  1. java大数据面试基础v2.docx

  2. 本文总结java 大数据等基础知识,可用于面试前的查漏补缺;包含java集合、多线程、异常;包含hadoop、hive、storm、spark、zookeeper、kafka等技术;包括mysql数据库的查询及优化知识点;包括vue、react等前端框架;也包括部门机器学习相关知识;供大家参考。
  3. 所属分类:Java

    • 发布日期:2020-09-29
    • 文件大小:7340032
    • 提供者:long199366
  1. java大数据面试基础v3.docx

  2. 本文总结java 、大数据有关基础技术知识,可用于面试前的查漏补缺;包含java集合、多线程、异常;包含hadoop、hive、storm、spark、zookeeper、kafka、flume等技术;包括mysql数据库的查询及优化知识点;包括vue、react等前端框架;也包括部门机器学习相关知识;包括版本管理、管理过程。供大家参考。 在《java大数据面试基础v2》的基础上进行了完善补充和丰富,增加flume模块,完善版本管理模块,部分章节进行了补充和完善。
  3. 所属分类:Java

    • 发布日期:2020-10-07
    • 文件大小:9437184
    • 提供者:long199366
  1. java大数据面试基础v2.docx

  2. 本文总结java 大数据等基础知识,可用于面试前的查漏补缺;包含java集合、多线程、异常;包含hadoop、hive、storm、spark、zookeeper、kafka等技术;包括mysql数据库的查询及优化知识点;包括vue、react等前端框架;也包括部门机器学习相关知识;供大家参考。
  3. 所属分类:Hadoop

    • 发布日期:2020-10-07
    • 文件大小:7340032
    • 提供者:long199366
  1. hive优化建议.docx

  2. 测试了关于hive优化的一些方法,ETL需要的朋友可以下载看看。
  3. 所属分类:Hive

    • 发布日期:2020-12-21
    • 文件大小:588800
    • 提供者:m0_37534613