您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. spark官方文档

  2. 1 概述(Overview) Spark SQL是Spark的一个组件,用于结构化数据的计算。Spark SQL提供了一个称为DataFrames的编程抽象,DataFrames可以充当分布式SQL查询引擎。 2 DataFrames DataFrame是一个分布式的数据集合,该数据集合以命名列的方式进行整合。DataFrame可以理解为关系数据库中的一张表,也可以理解为R/Python中的一个data frame。DataFrames可以通过多种数据构造,例如:结构化的数据文件、hive中的
  3. 所属分类:spark

    • 发布日期:2017-09-01
    • 文件大小:15728640
    • 提供者:qq_39532946
  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62
    • 提供者:huoyongjie698
  1. 2017最新大数据架构师精英课程

  2. 本资源为大数据基础到中高级教学资源,适合稍微有点大数据或者java基础的人群学习,资源过大,上传乃是下载链接,不多说,上目录: 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
  3. 所属分类:Java

  1. hive外部表创建

  2. 所属分类:其它

    • 发布日期:2016-08-23
    • 文件大小:197632
    • 提供者:qq_30948747
  1. Hive内部表和外部表

  2. 一:内部表和外部表的区别 创建表时使用关键字external创建的表就是外部表,没有使用该关键字创建的表就是内部表。 删除表时(drop table)内部表会删除hdfs对应路径,而外部表不会删除hdfs对应的路径, 删除表无论是内部表和外部表都会删除元数据(metastore.TBLS、metastore.COLUMNS_V2) 二:location关键字 用于指定hdfs路径,如果不指定则使用默认的路径,默认路径规则为//.db/,location既可以用于内部表也可以用于外部表。 hive
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:117760
    • 提供者:weixin_38655987
  1. Hive管理表和外部表的区别

  2. 前言: 所谓外部表,就是Hive并非认为其完全拥有这份数据。删除该表并不会删除掉这份数据,不过描述表的元数据信息会被删除掉。关于Hive数据仓库的管理表(MANAGED_TABLE)和外部表(EXTERNAL_TABLE)的区别,在创表的时候,如果不指定,则默认创建管理表。如果不知道此表是什么类型的表的话,可以在hive的命令行里打desc formatted table_name查看TABLE TYPE行查看;如果需要创建外部表则需要在创表的语句指定为external,如:create ext
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:36864
    • 提供者:weixin_38618140
  1. HIVE 自建落地表

  2. 自建落地表为什么要自建落地表HIVE SQL创建内/外部表、分区表insert overwrite 向分区表插入数据 为什么要自建落地表 1、公司的大数据资源非常紧张, 2、导数逻辑很复杂; 3、日常导数要求时效性高; 4、部门数仓的表太多字段; 综上四点,还有其他的原因;都需要我们自己落建地表,方便自己查询,以及加快BI报表直接用复杂的SQL语句跑数时间。 HIVE SQL创建内/外部表、分区表 1、创建内部表: CREATE TABLE `test`( `order_id` decima
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:117760
    • 提供者:weixin_38522106
  1. spark_streaming_of_twitter_data:一个Spark流传输管道,用于使用Twitter API将特定标签的Twitter数据实时摄取到CSV文件中的CSV文件中,然后使用CSV文件创建Hive外部表-源码

  2. spark_streaming_of_twitter_data Spark流传输管道使用Twitter API将特定主题标签的Twitter数据实时导入到CSV文件的CSV文件中,然后使用CSV文件创建Hive外部表。
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:5120
    • 提供者:weixin_42101720