您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Spark 2.0.2 Spark 2.2 中文文档

  2. 本资源为网页,不是PDF Apache Spark 2.0.2 中文文档 Spark 概述 编程指南 快速入门 Spark 编程指南 概述 Spark 依赖 Spark 的初始化 Shell 的使用 弹性分布式数据集(RDDS) 并行集合 外部数据集 RDD 操作 RDD 持久化 共享变量 Broadcast Variables (广播变量) Accumulators (累加器) 部署应用到集群中 使用 Java / Scala 运行 spark Jobs 单元测试 Spark 1.0 版本前
  3. 所属分类:spark

    • 发布日期:2017-12-07
    • 文件大小:62
    • 提供者:huoyongjie698
  1. 基于sacla开发sparksql、sparksession所需要的jar包.rar

  2. 通过import org.apache.spark.sql.SparkSession等导入所需要的jar包,基本涵盖了sparksql所需要的jar包
  3. 所属分类:spark

    • 发布日期:2020-03-17
    • 文件大小:48234496
    • 提供者:weixin_40758648
  1. EMR-S3-Pyspark:在这个项目中,我分析了Yelp业务,评论和用户数据的一部分,以回答以下三个问题:Yelp评论是否偏向负? 精英应该被信任吗? 什么是最推荐餐厅?-源码

  2. 分析10GB的Yelp数据 在这个项目中,我分析了Yelp业务,评论和用户数据的一部分,以回答以下三个问题: Yelp是否评论偏斜片? 精英应该被信任吗? 什么是最推荐餐厅? 此项目中使用的三个数据集最初来自 ,它们已上传到S3存储桶中: s3://yelpreviewdataset/yelp_academic_dataset_business.json s3://yelpreviewdataset/yelp_academic_dataset_review.json s3://ye
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:1048576
    • 提供者:weixin_42139871