您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据spark学习之rdd概述

  2. RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。在 Spark 中,对数据的所有操作不外乎创建 RDD、转化已有RDD 以及调用 RDD 操作进行求值。每个 RDD 都被分为多个分区,这些分区运行在集群中的不同节点上。RDD 可以包含 Python、Java、Scala 中任意类型的对象, 甚至可以包含用户自定义的对象。RDD具有数据流模型的特点:自动容错、位置感知性调
  3. 所属分类:互联网

    • 发布日期:2020-05-03
    • 文件大小:3072
    • 提供者:fy1235