您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. NoSQL数据库笔谈

  2. 颜开 v0.2 2010.2 序 ................................................................................................... 3 思想篇 思想篇.............................................................................................. 4 CAP ......................
  3. 所属分类:其它

    • 发布日期:2011-10-08
    • 文件大小:2097152
    • 提供者:a280606790
  1. Big Data Glossary

  2. To help you navigate the large number of new data tools available, this guide describe 60 of the most recent innovations, from NOSQL databases and MapReudce approaches to machine learning and visualization tools. Descr iptions are based on firsthand
  3. 所属分类:其它

    • 发布日期:2014-02-10
    • 文件大小:5242880
    • 提供者:fffjjjhhhttt
  1. mapreduce与drools整合代码

  2. mapreduce与规则引擎drools整合,提供在大数据环境下的规则引擎使用样例代码
  3. 所属分类:Hadoop

    • 发布日期:2018-08-19
    • 文件大小:26214400
    • 提供者:amen000
  1. Spark大数据技术与应用课件

  2. spark学习课件,让你深入浅出学习spark。Spark是Hadoop MapReduce的替代方案。MapReudce不适合迭代和交互式任务,Spark主要为交互式查询和迭代算法设计,支持内存存储和高效的容错恢复。Spark拥有MapReduce具有的优点,但不同于MapReduce,Spark中间输出结果可以保存在内存中,减少读写HDFS的次数。
  3. 所属分类:spark

    • 发布日期:2019-02-21
    • 文件大小:37748736
    • 提供者:youtherwy
  1. Sparkvs.MapReduce时间节约66%,计算节约40%

  2. 本文将介绍基于物品的协同过滤推荐算法案例在TDWSpark与MapReudce上的实现对比,相比于MapReduce,TDWSpark执行时间减少了66%,计算成本降低了40%。MapReduce为大数据挖掘提供了有力的支持,但是复杂的挖掘算法往往需要多个MapReduce作业才能完成,多个作业之间存在着冗余的磁盘读写开销和多次资源申请过程,使得基于MapReduce的算法实现存在严重的性能问题。后起之秀Spark得益于其在迭代计算和内存计算上的优势,可以自动调度复杂的计算任务,避免中间结果的磁
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:235520
    • 提供者:weixin_38601364
  1. Hadoop中MapReduce框架入门

  2. MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题.对于业界的大数据存储及分布式处理系统来说Hadoop2提出的新MapReudce就是YARN:Aframeworkforjobschedulingandclusterresourcemanagement.百度百科:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:900096
    • 提供者:weixin_38699784
  1. Sparkvs.MapReduce时间节约66%,计算节约40%

  2. 本文将介绍基于物品的协同过滤推荐算法案例在TDWSpark与MapReudce上的实现对比,相比于MapReduce,TDWSpark执行时间减少了66%,计算成本降低了40%。MapReduce为大数据挖掘提供了有力的支持,但是复杂的挖掘算法往往需要多个MapReduce作业才能完成,多个作业之间存在着冗余的磁盘读写开销和多次资源申请过程,使得基于MapReduce的算法实现存在严重的性能问题。后起之秀Spark得益于其在迭代计算和内存计算上的优势,可以自动调度复杂的计算任务,避免中间结果的磁
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:235520
    • 提供者:weixin_38731979
  1. Hadoop中MapReduce框架入门

  2. MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题.对于业 界的大数据存储及分布式处理系统来说Hadoop2提出的新MapReudce就是YARN:Aframework forjobschedulingandclusterresourcemanagement.百度百科:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和他们的主要思想,都是从
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:900096
    • 提供者:weixin_38644688