您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Alluxio 分布式安装

  2. 对alluxio(原名:tachyon)进行了编译,然后进行集群分布式安装
  3. 所属分类:互联网

    • 发布日期:2016-07-13
    • 文件大小:600064
    • 提供者:wjqwinn
  1. spark 集群环境开发部署(hadoop,yarn,zookeeper,alluxio,idea开发环境)

  2. 个人总结的集群搭建运行事例环境文档。条理清晰。有spark standalone模式 yarn模式 zookeeper的搭建 还有分布式文件系统hdfs hadoop搭建,内存式文件系统alluxio。开发环境的搭建idea for scala 的配置 ,和打包事例
  3. 所属分类:其它

    • 发布日期:2016-10-25
    • 文件大小:412672
    • 提供者:baidu_20559131
  1. presto集成tachyon(alluxio)

  2. presto集成tachyon
  3. 所属分类:其它

    • 发布日期:2016-11-21
    • 文件大小:24576
    • 提供者:woshi0204
  1. Scala and Spark for Big Data Analytics

  2. Scala has been observing wide adoption over the past few years, especially in the field of data science and analytics. Spark, built on Scala, has gained a lot of recognition and is being used widely in productions. Thus, if you want to leverage the
  3. 所属分类:spark

    • 发布日期:2017-09-14
    • 文件大小:20971520
    • 提供者:liypcdl
  1. Hadoop生态圈常用软件打包rpm spec描述文件

  2. Hadoop生态圈常用软件打包rpm spec描述文件,包括 Hadoop,spark, alluxio,spark,ranger等
  3. 所属分类:Hadoop

  1. HDFS集中式缓存

  2. DFS中的集中化缓存管理是一个明确的缓存机制,它允许用户指定要缓存的HDFS路径。NameNode会和保存着所需快数据的所有DataNode通信,并指导他们把块数据缓存在off-heap缓存中
  3. 所属分类:Hadoop

    • 发布日期:2018-06-04
    • 文件大小:54272
    • 提供者:chenfengwhere
  1. Next-Generation Big Data: A Practical Guide to Apache Kudu, Impala, and Spark

  2. Utilize this practical and easy-to-follow guide to modernize traditional enterprise data warehouse and business intelligence environments with next-generation big data technologies. Next-Generation Big Data takes a holistic approach, covering the mo
  3. 所属分类:spark

    • 发布日期:2018-06-14
    • 文件大小:20971520
    • 提供者:sinat_41581062
  1. Alluxio java 客户端demo

  2. 一个简单的Alluxio java 客户端代码,包含文件创建,读取,删除等
  3. 所属分类:Hadoop

    • 发布日期:2018-09-25
    • 文件大小:30720
    • 提供者:u012543819
  1. Apache Hadoop---Alluxio.docx

  2. Tachyon(/'tæki:ˌɒn/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。 从软件栈的层次来看,Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层。它利用底层文件系统作为备份,对于上层应用来说,Tachyon就是一个分布式文件系统。
  3. 所属分类:Hadoop

    • 发布日期:2020-06-11
    • 文件大小:406528
    • 提供者:qq_31641743
  1. Alluxio数据随机访问方法的研究

  2. Alluxio数据随机访问方法的研究
  3. 所属分类:其它

    • 发布日期:2020-10-14
    • 文件大小:684032
    • 提供者:chunze
  1. Alluxio分布式存储系统 v2.4.0

  2. 为您提供Alluxio分布式存储系统下载,Alluxio(以前称为Tachyon)是一个虚拟的分布式存储系统。它弥合了计算框架和存储系统之间的鸿沟,使计算应用程序可以通过公共接口连接到众多存储系统。Alluxio项目源自加州大学伯克利分校AMPLab的一个名为Tachyon的研究项目,该项目是伯克利数据分析堆栈(BDAS)的数据层。Alluxio大数据存储系统的功能:1、灵活的文件API:Alluxio的本地API类似于java.io.F
  3. 所属分类:其它

    • 发布日期:2020-11-02
    • 文件大小:14680064
    • 提供者:weixin_38705014
  1. Alluxio分布式存储系统 v2.4.1

  2. 为您提供Alluxio分布式存储系统下载,Alluxio(以前称为Tachyon)是一个虚拟的分布式存储系统。它弥合了计算框架和存储系统之间的鸿沟,使计算应用程序可以通过公共接口连接到众多存储系统。Alluxio项目源自加州大学伯克利分校AMPLab的一个名为Tachyon的研究项目,该项目是伯克利数据分析堆栈(BDAS)的数据层。Alluxio大数据存储系统的功能:1、灵活的文件API:Alluxio的本地API类似于java.io.F
  3. 所属分类:其它

    • 发布日期:2020-12-29
    • 文件大小:14680064
    • 提供者:weixin_38553381
  1. Alluxio-Internal:Alluxio原始码分析,学习-源码

  2. 内部Alluxio 经过最近对alluxio的研究,本着自身学习记录,同时因为当前对alluxio似乎还没有比较全面,深入的分析。和解决的坑。alluxio使用的源码是1.4.0。 ##简单介绍 alluxio和hdfs一些类似,都是分布式的文件系统,hdfs基于磁盘介质存储,alluxio基于内存介质存储; hdfs基于副本的方式进行容错,alluixo基于lineage的方式进行容错(目前容错性处于测试阶段,而不是完善,建议重要数据还是需要持久化到重叠的文件系统); alluxio和hdf
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:70656
    • 提供者:weixin_42131890
  1. Spark生态系统组件

  2. 言:随着大数据技术的发展,实时流计算、机器学习、图计算等领域成为较热的研究方向,而Spark作为大数据处理的“利器”有着较为成熟的生态圈,能够一站式解决类似场景的问题。那么Spark生态系统中有哪些组件你知道吗?下面让我们跟着本文一同了解下这些不可或缺的组件。本文选自《图解Spark:核心技术与案例实战》。Spark生态系统以SparkCore为核心,能够读取传统文件(如文本文件)、HDFS、AmazonS3、Alluxio和NoSQL等数据源,利用Standalone、YARN和Mesos等资
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:354304
    • 提供者:weixin_38667849
  1. ApacheRanger剖析:Hadoop生态圈的安全管家

  2. 2016年,Hadoop迎来了自己十周岁生日。过去的十年,Hadoop雄霸武林盟主之位,号令天下,引领大数据技术生态不断发展壮大,一时间百家争鸣,百花齐放。然而,兄弟多了不好管,为了抢占企业级市场,各家都迭代出自己的一套访问控制体系,不管是老牌系统(比如HDFS、HBase),还是生态新贵(比如Kafka、Alluxio),ACL(AccessControlList)支持都是Roadmap里被关注最高的issue之一。历史证明跳出混沌状态的最好方式就是——出台标准。于是,Hadoop两大厂Clo
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:152576
    • 提供者:weixin_38608189
  1. alluxio:Alluxio,用于云中分析和机器学习的数据编排-源码

  2. 什么是Alluxio (以前称为Tachyon)是一个虚拟的分布式存储系统。 它弥合了计算框架和存储系统之间的鸿沟,使计算应用程序可以通过公共接口连接到众多存储系统。 了解有关更多信息。 Alluxio项目源自加州大学伯克利分校AMPLab的一个名为Tachyon的研究项目,该项目是伯克利数据分析堆栈( )的数据层。 有关更多详细信息,请参阅Li Li的博士学位论文。 谁使用Alluxio 在许多领先的公司中,Alluxio用于生产中以管理PB级数据,最大部署超过3,000个节点。
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:14680064
    • 提供者:weixin_42135753
  1. gimel:大数据处理框架-任何存储上的统一数据API或SQL-源码

  2. Gimel数据API Gimel提供了统一的数据API,可从任何存储访问数据,例如HDFS,GS,Alluxio,Hbase,Aerospike,BigQuery,Druid,Elastic,Teradata,Oracle,MySQL,SFTP等。 文档和入门 问题
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:50331648
    • 提供者:weixin_42116604
  1. 喜p:喜p包含许多用于在HPC环境(包括Hadoop和Spark)中运行大数据软件的脚本。 支持Lustre,Slurm,Moab和Torque。 LSF等-源码

  2. 鹊 喜p包含许多用于在HPC环境中运行大数据软件的脚本。 到目前为止,支持Hadoop,Spark,Hbase,Storm,Pig,Mahout,Phoenix,Kafka,Zeppelin,Zookeeper和Alluxio。 它当前支持在并行文件系统Lustre上运行,以及在任何通用网络文件系统上运行。 Slurm,Moab,Torque和LSF有计划程序/资源管理器支持。 目前支持的一些功能: 以交互方式或通过脚本运行作业。 针对许多文件系统选项运行,例如HDFS,Lustre上的H
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:3145728
    • 提供者:weixin_42161497
  1. Spark生态系统组件

  2. 言:随着大数据技术的发展,实时流计算、机器学习、图计算等领域成为较热的研究方向,而Spark作为大数据处理的“利器”有着较为成熟的生态圈,能够一站式解决类似场景的问题。那么Spark生态系统中有哪些组件你知道吗?下面让我们跟着本文一同了解下 这些不可或缺的组件。本文选自《图解Spark:核心技术与案例实战》。Spark生态系统以SparkCore为核心,能够读取传统文件(如文本文件)、HDFS、Amazon S3、Alluxio和NoSQL等数据源,利用Standalone
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:354304
    • 提供者:weixin_38746918
  1. Apache Ranger剖析:Hadoop生态圈的安全管家

  2. 2016年,Hadoop迎来了自己十周岁生日。过去的十年,Hadoop雄霸武林盟主之位,号令天下,引领大数据技术生态不断发展壮大,一时间百家争鸣,百花齐放。然而,兄弟多了不好管,为了抢占企业级市场,各家都迭代出自己的一套访问控制体系,不管是老牌系统(比如HDFS、HBase),还是生态新贵(比如Kafka、Alluxio),ACL(Access Control List)支持都是Roadmap里被关注最高的issue之一。
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:155648
    • 提供者:weixin_38745361