您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Apache Hadoop---Spark.docx

  2. Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UCBerkeleyAMPlab(加州大学伯克利分校的AMP实验室)所开源的类HadoopMapReduce的通用并行框架,Spark,拥有HadoopMapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark是一种与Hadoop相似的开源集群计算环境,但是两者之
  3. 所属分类:spark

    • 发布日期:2020-06-12
    • 文件大小:507904
    • 提供者:qq_31641743
  1. Apache Hadoop---Alluxio.docx

  2. Tachyon(/'tæki:ˌɒn/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。 从软件栈的层次来看,Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层。它利用底层文件系统作为备份,对于上层应用来说,Tachyon就是一个分布式文件系统。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:406528
    • 提供者:qq_31641743