您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. mapreduce中文版

  2. Map Reduce 分布式计算框架,看着简单,做起来难
  3. 所属分类:其它

    • 发布日期:2011-07-05
    • 文件大小:460800
    • 提供者:shenboqing
  1. 分布式计算开源框架Hadoop_入门实践

  2. 分布式计算开源框架Hadoop 的入门教程
  3. 所属分类:Java

    • 发布日期:2014-06-28
    • 文件大小:301056
    • 提供者:fleesely
  1. Spark一个高效的分布式计算系统

  2. Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
  3. 所属分类:其它

    • 发布日期:2015-02-02
    • 文件大小:259072
    • 提供者:stockjava
  1. 分布式计算开源框架Hadoop介绍

  2. Hadoop框架中最核心的设计就是:MapReduce和HDFS。MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。
  3. 所属分类:专业指导

    • 发布日期:2008-12-15
    • 文件大小:142336
    • 提供者:hlking
  1. MapReduce并行模型ž‹.pdf

  2. MapReduce是采用一种**分而治之**的思想设计出来的分布式计算框架 - 如一复杂或计算量大的任务,单台服务器无法胜任时,可将此大任务切分成一个个小的任务,小任务分别在不同的服务器上**并行**的执行;最终再汇总每个小任务的结果 - MapReduce由两个阶段组 成:Map阶段(切分成一个个小的任务)、Reduce阶段(汇总小任务的结果)
  3. 所属分类:Java

    • 发布日期:2019-07-16
    • 文件大小:3145728
    • 提供者:weixin_40902527
  1. 分布式计算框架Paracel.zip

  2. Paracel 是一个分布式计算框架,用于解决机器学习的问题:逻辑回归、SVD、矩阵分解(BFGS,sgd,als,cg),LDA,Lasso...首先,Paracel 拆分成大规模数据集和大量的参数空间。不像类 Mapreduce 系统,Paracel 提供一个简单的沟通模型,可以让你使用全局的,分布式的密钥值存储,这就是所谓的参数服务器。 标签:Paracel
  3. 所属分类:其它

    • 发布日期:2019-07-17
    • 文件大小:392192
    • 提供者:weixin_39840515
  1. MapReduce--分布式计算框架

  2. 所属分类:Java

    • 发布日期:2017-02-24
    • 文件大小:3145728
    • 提供者:demon_ll
  1. 基于MapReduce的频繁项目集挖掘算法在煤炭销售系统中的研究

  2. 煤炭系统中,往往希望分析不同煤炭产品购买之间的关联规则,并通过一定的关联性推荐煤炭商品,有助于购买者购买并取得更高的销售量。发掘频繁项目集是关联规则中经常用到的关键技术。随着煤炭系统数据库中信息的增多,原有的频繁项目集挖掘算法无法快速高效地完成频繁项目的挖掘。针对海量数据信息频繁项目集挖掘问题,提出了分布式频繁项目集挖掘算法,该算法是基于MapReduce分布式计算框架,能够高效地完成数据库中的频繁项目挖掘工作。通过实验结果证明该算法具有很高的效率及可扩展性。
  3. 所属分类:其它

    • 发布日期:2020-07-07
    • 文件大小:550912
    • 提供者:weixin_38691453
  1. 基于海量高维煤炭数据的分布式贝叶斯算法的研究与应用

  2. 随着信息技术的快速发展,在煤炭产业中也挖掘出了大量的煤炭数据。煤炭产业管理者希望能够应用现有的煤炭数据进行分析预测,但是海量煤炭数据的处理分析是一地大难点。文章针对煤炭数据的分类问题,提出了基于MapReduce分布式计算框架的贝叶斯分类算法,该算法分布式地完成分类问题,能够更加快速、有效地处理大规模的数据。通过文中的实验结果也进一步说明文中提出的分布式贝叶斯分类算法有很高的效率,与传统算法相比有明显的加速比,并且,该算法也具有很好的可扩展性。
  3. 所属分类:其它

    • 发布日期:2020-07-06
    • 文件大小:514048
    • 提供者:weixin_38650516
  1. 第4讲_分布式计算框架mapreduce.pdf

  2. 第4讲_分布式计算框架mapreduce.pdf
  3. 所属分类:Hadoop

    • 发布日期:2020-08-20
    • 文件大小:949248
    • 提供者:cntaizi
  1. Hadoop中MapReduce基本案例及代码(一)

  2. 概念 MapReduce是hadoop分布式计算框架。 MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。 下面以一个统计单词次数简单案例为例: 数据源 Map类 import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; //
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:219136
    • 提供者:weixin_38517212
  1. Spark:一个高效的分布式计算系统

  2. Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。其架构如下图所示:Spark的中间数据放到内存中,对于迭代运算效率更高。Spark更适合于迭代运算比较多的ML和D
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:313344
    • 提供者:weixin_38648396
  1. SparkStreaming实时计算框架介绍

  2. 随着大数据的发展,人们对大数据的处理要求也越来越高,原有的批处理框架MapReduce适合离线计算,却无法满足实时性要求较高的业务,如实时推荐、用户行为分析等。SparkStreaming是建立在Spark上的实时计算框架,通过它提供的丰富的API、基于内存的高速执行引擎,用户可以结合流式、批处理和交互试查询应用。本文将详细介绍SparkStreaming实时计算框架的原理与特点、适用场景。Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集,提供了比MapRedu
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:266240
    • 提供者:weixin_38516380
  1. 分布式计算框架Hadoop原理及架构全解

  2. 本文来自于csdn,这篇文章讲解了分布式计算框架的核心内容、架构图详解,运用流程等Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括HadoopCommon、HDFS与MapReduce。HDFSHDFS是Hadoop分布式文件系统(HadoopDistributedFileSystem)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型主机处理性能。HDFS架构原理HDFS采用maste
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:256000
    • 提供者:weixin_38509504
  1. 分布式计算框架MapReduce

  2. 本文来自于51cto,文章介绍了MapReduce是什么、MapReduce执行流程以及MapReduce1.x架构和MapReduce2.x架构等相关内容。MapReduce源自Google的MapReduce论文,论文发表于2004年12月。HadoopMapReduce可以说是GoogleMapReduce的一个开源实现。MapReduce优点在于可以将海量的数据进行离线处理,并且MapReduce也易于开发,因为MapReduce框架帮我们封装好了分布式计算的开发。而且对硬件设施要求不高
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:1048576
    • 提供者:weixin_38654944
  1. PowerJob:具有分布式计算能力的企业作业调度中间件-源码

  2. English | 是一个开源的分布式计算和作业调度框架,它使开发人员可以轻松地在自己的应用程序中调度任务。 有关详细信息,请参阅。 介绍 产品特点 友好的用户界面:提供了页面,开发人员可以管理任务,监视状态,在线检查日志等。 丰富的时序策略:支持四种时序策略,包括CRON表达式,固定速率,固定延迟和OpenAPI,它们使您可以定义自己的调度策略,例如延迟执行。 多种执行模式:支持四种执行模式,包括独立,广播,Map和MapReduce。 分布式计算资源可以在MapReduce模式下使用
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:2097152
    • 提供者:weixin_42116701
  1. Spark:一个高效的分布式计算系统

  2. Spark是UCBerkeleyAMPlab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。其架构如下图所示:Spark的中
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:313344
    • 提供者:weixin_38713009
  1. 分布式计算框架Hadoop原理及架构全解

  2. 本文来自于csdn,这篇文章讲解了分布式计算框架的核心内容、架构图详解,运用流程等Hadoop是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括Hadoop Common、HDFS与MapReduce。HDFSHDFS是Hadoop分布式文件系统(Hadoop DistributedFileSystem)的缩写,为分布式计算存储提供了底层支持。采用Java语言开发,可以部署在多种普通的廉价机器上,以集群处理数量积达到大型主机处理性能。HDFS
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:256000
    • 提供者:weixin_38635449
  1. 分布式计算框架MapReduce

  2. 本文来自于51cto,文章介绍了MapReduce是什么、MapReduce执行流程以及MapReduce1.x架构和MapReduce2.x架构等相关内容。 MapReduce源自Google的MapReduce论文,论文发表于2004年12月。Hadoop MapReduce可以说是GoogleMapReduce的一个开源实现。MapReduce优点在于可以将海量的数据进行离线处理,并且MapReduce也易于开发,因为MapReduce框架帮我们封装好了分布式计算的开发
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:1048576
    • 提供者:weixin_38555616
  1. Hadoop之mr分布式计算机框架

  2. Hadoop之mr分布式计算机框架 Hadoop核心组件–MR Hadoop 分布式计算框架 1.MapReduce设计理念 何为分布式计算 移动计算,而不是移动数据 2.计算机框架MR 从HDFS存储的数据/文件作为输入(MR的数据来源) 对于这些数据首先要处理成一个个片段 split 每个片段都有个map线程去执行 reduce步骤 生成数据默认也保存在HDFS上 MR对很大的数据统计所有单词出现的次数的过程 分为四个步骤 splitting mapping(java线程执行分析数据片段
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:757760
    • 提供者:weixin_38735182
« 12 3 4 5 6 7 8 9 10 »