您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Spark快速数据处理-mini版

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等各大公司等。 本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱
  3. 所属分类:互联网

    • 发布日期:2014-05-19
    • 文件大小:2097152
    • 提供者:hzbooks
  1. Spark实战高手之路-第一章 第3步

  2. Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题,具有完善的生态系统,这直接奠定了其一统云计算大数据的霸主地位。
  3. 所属分类:其它

  1. Spark-1.0.2安装配置

  2. Spark-1.0.2安装配置,简单的demo运行,包含vbox、jdk、Scala、SSH的安装配置
  3. 所属分类:Java

    • 发布日期:2014-09-04
    • 文件大小:2097152
    • 提供者:wangtarry
  1. 你需要Spark的10个理由

  2. 你需要Spark的十大理由: 1,Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了100倍以上: Logistic regression in Hadoop and Spark 可以看出在Spark特别擅长的领域其速度比Hadoop快120倍以上! 2,原先支持Hadoop的四大商业机构纷纷宣布支持Spark,包含知名Hadoop解决方案供应商Cloudera和知名的Hadoop供应商MapR; 3,Spark是继Hadoop之后,成
  3. 所属分类:虚拟化

    • 发布日期:2014-09-22
    • 文件大小:27648
    • 提供者:javaniceyou
  1. 精通Spark内核

  2. 精通Spark内核:此阶段聚焦于Spark内核的设计、实现和核心源码解析,对内核中的实现架构、运行原理、性能调优和核心源码各个击破: 1, 通过源码精通Spark内核实现和任务调度; 2,精通RDD、DAGScheduler、TaskScheduler和Worker节点内部的工作的每一步的细节; 3,精通Job的逻辑执行和物理执行; 4,精通Shuffle、Cache、Checkpoint和Broadcast 掌握此阶段即可跻身于Spark内核高手之列!
  3. 所属分类:3G/移动开发

    • 发布日期:2014-10-22
    • 文件大小:36700160
    • 提供者:rocky_wangjialin
  1. Spark快速数据处理

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。   《Spark快速数据处理》系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群
  3. 所属分类:Java

    • 发布日期:2015-01-22
    • 文件大小:18874368
    • 提供者:xcgh
  1. Spark快速数据处理-前三章

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。
  3. 所属分类:Java

    • 发布日期:2015-05-25
    • 文件大小:2097152
    • 提供者:aa_moon
  1. Spark快速数据处理完整版

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立
  3. 所属分类:其它

    • 发布日期:2015-05-30
    • 文件大小:18874368
    • 提供者:qianru2011
  1. Spark快速数据处理 完整版

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范
  3. 所属分类:其它

    • 发布日期:2015-08-21
    • 文件大小:18874368
    • 提供者:lihongxi
  1. Spark快速数据处理

  2. Spark是一个通用的并行分布式计算框架,由UCBerkeley的AMP实验室开发。Spark使得程序员更容易地编写分布式应用,并且能够根据自己的喜好使用Scala、Java或者Python作为开发语言。本书系统讲解了Spark的应用方法,包括如下内容:第1章介绍如何在多种机器上安装Spark,以及如何配置一个Spark集群。第2章介绍如何在交互模式下运行第一个Spark作业。第3章介绍如何在Spark集群上构建一个生产级的脱机\独立作业。第4章介绍如何与Spark集群建立连接,以及Spark
  3. 所属分类:其它

    • 发布日期:2015-08-31
    • 文件大小:24117248
    • 提供者:hx0_0_8
  1. Spark-Meets-Genomics-Helping-Fight-the-Big-C-with-the-Big-D-David-Patterson

  2. 2014年Spark Summit于6月30日至7月2日在美国旧金山举行。Spark、Shark、Spark流媒体和相关项目及产品的主要用户聚集一地,共同探讨Spark项目开发的方向,以及Spark在各种各样应用程序中的实践情况。
  3. 所属分类:讲义

    • 发布日期:2015-09-22
    • 文件大小:4194304
    • 提供者:karamos
  1. Spark-on-YARN-A-Deep-Dive-Sandy-Ryza

  2. 2014年Spark Summit于6月30日至7月2日在美国旧金山举行。Spark、Shark、Spark流媒体和相关项目及产品的主要用户聚集一地,共同探讨Spark项目开发的方向,以及Spark在各种各样应用程序中的实践情况。
  3. 所属分类:讲义

    • 发布日期:2015-09-22
    • 文件大小:5242880
    • 提供者:karamos
  1. Spark快速数据处理

  2. Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。 《Spark快速数据处理》系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构
  3. 所属分类:spark

    • 发布日期:2018-07-17
    • 文件大小:13631488
    • 提供者:r115277
  1. 大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源

  2. 大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源
  3. 所属分类:互联网

  1. 大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源

  2. 大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源
  3. 所属分类:互联网

  1. 揭秘Sponge:统一Hadoop、Spark、SDS、Swift的大数据操作系统

  2. 摘要:Sponge是一个简单多层,兼容完全POSIX兼容的分布式NFS、Hadoop,支持对象存储、云存储、SDS、容器机制,集成Spark为计算引擎,基于内存计算技术的分布式系统,将大数据的存储、管理和计算有机融合,具有实时一致性。使用对象存储、高性能存储、Hadoop、Spark、Storm……等技术来存储、处理和分析大数据很流行,然而海绵数据科技有限公司(以下简称“海绵数据”)说,这些技术各自为政,存在性能、管理、开发、成本等多方面的问题。5月20日,海绵数据宣布推出其第二代大数据操作系统
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:428032
    • 提供者:weixin_38595690
  1. Spark知识体系完整解读

  2. Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。Spark将分布式数据抽象为弹性分布式数据集(RDD),实现了应用任务调度、RPC、序列化和压缩,并为运行在其上的上层组件提供API。其底层采用Scala这种函数式语言书写而成,并且所提供的API深度借鉴Scala函数式的编程思想,提供与Scala
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:441344
    • 提供者:weixin_38519387
  1. 揭秘Sponge:统一Hadoop、Spark、SDS、Swift的大数据操作系统

  2. 摘要:Sponge是一个简单多层,兼容完全POSIX兼容的分布式NFS、Hadoop,支持对象存储、云存储、SDS、容器机制,集成Spark为计算引擎,基于内存计算技术的分布式系统,将大数据的存储、管理和计算有机融合,具有实时一致性。使用对象存储、高性能存储、Hadoop、Spark、Storm……等技术来存储、处理和分析大数据很流行,然而海绵数据科技有限公司(以下简称“海绵数据”)说,这些技术各自为政,存在性能、管理、开发、成本等多方面的问题。5月20日,海绵数据宣布推出其第二代大数据操作系统
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:428032
    • 提供者:weixin_38653694
  1. Spark知识体系完整解读

  2. Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map 函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。 Spark将分布式数据抽象为弹性分布式数据集(RDD),实现了应用任务调度、RPC、序列化和压缩,并为运行在其上的上层组件提供API。其底层采用Scala这种函数式语言书写而成,并且所提供的API深度借鉴Scala函数式的
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:441344
    • 提供者:weixin_38742421
  1. Spark的核心组件

  2. Spark的出现 Apache Spark: 1.一个大规模数据处理同一分析引擎 2.最初由美国加州破壳利大学的AMP实验室开发 3.基于内存计算的大数据并行计算框架 4.用于构建大型的、低延迟的数据分析应用程序 Spark的特点 1.速度快 采用先进的DAG调度程序 查询优化器 物理执行引擎 2.容易使用 提供了超过80种高级运算符 支持多种语言进行编程 Spark Shell交互式编程 3.完整强大的技术栈 SQL查询 流式计算 机器学习 图计算组件 4.运行模式多样 可运行与独立的集群模式
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:73728
    • 提供者:weixin_38635996
« 12 3 4 5 6 7 8 9 10 ... 50 »