您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Kylo为企业级的数据湖赋能

  2. Kylo作为开源数据湖DataLake的解决方案,对企业进行数据湖DataLake实施进行了相关介绍,包括Kylo是如何解决业务人员与IT人员之间的鸿沟,如何构建基于数据湖驱动的企业文化和数据民主进行了阐述。
  3. 所属分类:互联网

    • 发布日期:2017-02-26
    • 文件大小:140288
    • 提供者:kaizhao_kz
  1. 数据湖——一种更好的大数据存储架构.pdf

  2. 数据湖”是通过将原始数据分类存储到不同数据池,并在各数据池里将数据整合转化成容易分析的统一存储格式进行存储,以方便用户对大量原始数据池中原本几近废弃的数据加以分析利用,从而产生经济效益。该文首先介绍了数据湖的结构,其次介绍了数据湖中各数据池的特点及应用;最后介绍了各数据池之间的联系并举例说明了数据湖的架构
  3. 所属分类:其它

    • 发布日期:2020-07-08
    • 文件大小:1048576
    • 提供者:yiti8689
  1. 基于数据湖的精准广告投放系统技术解密.pdf

  2. 2019云栖大会-基于数据湖的精准广告投放系统技术解密,广告时代已过去,窄告时代已来临,如何利用技术手段做好精准营销。
  3. 所属分类:算法与数据结构

    • 发布日期:2020-07-21
    • 文件大小:8388608
    • 提供者:yejingtao703
  1. 华为智能数据湖运营平台DAYU准备工作.pdf

  2. 华为智能数据湖运营平台DAYU准备工作
  3. 所属分类:互联网

    • 发布日期:2020-12-23
    • 文件大小:1048576
    • 提供者:souker
  1. 华为智能数据湖运营平台DAYU用户指南.pdf

  2. 华为智能数据湖运营平台DAYU用户指南
  3. 所属分类:互联网

    • 发布日期:2020-12-23
    • 文件大小:17825792
    • 提供者:souker
  1. 华为智能数据湖运营平台DAYU数据治理方法论.pdf

  2. 华为智能数据湖运营平台DAYU数据治理方法论
  3. 所属分类:互联网

    • 发布日期:2020-12-23
    • 文件大小:1048576
    • 提供者:souker
  1. DummyDataLake:数据湖实现学习-源码

  2. 虚拟数据湖 数据湖实现学习
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:74752
    • 提供者:weixin_42109598
  1. 《阿里云云原生数据湖体系全解读》首次揭秘如何构建阿里云云原生数据湖体系.pdf

  2. 《阿里云云原生数据湖体系全解读》首次揭秘如何构建阿里云云原生数据湖体系
  3. 所属分类:算法与数据结构

    • 发布日期:2021-03-09
    • 文件大小:3145728
    • 提供者:celinsw
  1. 初探数据湖(DataLake),到底有什么用?让我们来一窥究竟...

  2. 数据湖的概念最早是2011年提出来的,最初数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。关于数据湖的定义,维基百科上是这样讲的:数据湖(DataLake)是一个以原
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:822272
    • 提供者:weixin_38736721
  1. 数据湖(DataLake)-剑指下一代数据仓库

  2. 数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。数据湖正在成为一种越来越流行的大数据解决方案,而数据湖这个词已经被大数据供应商赋予了太多不同的含义,如果有什么工作是传
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:311296
    • 提供者:weixin_38637805
  1. 谈数据解读:AWS数据湖

  2. Datalake,我第一次接触这个概念,是在2014年IBM组织的数据治理交流论坛上。当时只是认为“数据湖”就是一个概念,没什么新意,“不就是把不同结构的数据实现统一存储,Hadoop不就是干这个活的吗?本质上还是换汤不换药、新瓶装老酒,又一个新概念”!后来发现,主流的大数据和云计算公司都在推这个叫“数据湖”的技术。于是,我特意上网百度了一下,“数据湖”的概念原来早在2011年被首次提出,维基百科对它给出了如下的定义:数据湖(DataLake)是一个以原始格式存储数据的存储库或系统,它按原样存储
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:452608
    • 提供者:weixin_38608875
  1. 什么是数据湖?有什么用?看了这一篇你就明白了……

  2. 数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始,企业对种类庞杂的应用程序的管理都经历了一个比较自然的演化周期。最开始的时候,每个应用程序会产生、存储大量的数据,而这些数据并不能被其他应用程序使用,这种状况导致了数据孤岛的产生。随后数据集市应运而生,应用程序产生的数据存储在一个集中式的数据仓库中,可根据需要导出相关数据传输给企业内需要该数据的部门或个人。然而数据集市只解决了部分问题。剩余问题,包括数据管理、数据所有权与访问控制等都亟须解决,因为企业寻求获得更高的使
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:434176
    • 提供者:weixin_38678172
  1. 一文读懂数据湖及企业中的架构特点

  2. 数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始的时候,每个应用程序会产生、存储大量数据,而这些数据并不能被其他应用程序使用,这种状况导致数据孤岛的产生。随后数据集市应运而生,应用程序产生的数据存储在一个集中式的数据仓库中,可根据需要导出相关数据传输给企业内需要该数据的部门或个人。然而数据集市只解决了部分问题。剩余问题,包括数据管理、数据所有权与访问控制等都亟须解决,因为企业寻求获得更高的使用有效数据的能力。为了解决前面提及的各种问题,企业有很强烈的诉求搭建自己的
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:794624
    • 提供者:weixin_38743391
  1. 从数据仓库到数据湖——浅谈数据架构演进

  2. 传统的数据仓库技术从现在的大数据的角度来看,业内人能够明白深深其中的挑战。一个运行了20多年的数据架构,必然有其合理性。也正是因为年代久远,存量过多,才导致举步维艰。在Cloud和5G时代,超密度网络集成和大数据洞察需求给企业客户带来新的挑战,从数据仓库到数据湖,不仅仅架构的变革,更是思维方式的升级。本文尝试梳理数据架构的演进过程。数据仓库历史沿革数据仓库概念数据仓库架构数据立方体数据库建模大数据架构数据湖架构演进路径实践1970年,关系数据库的研究原型SystemR和INGRES开始出现,这两
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:1048576
    • 提供者:weixin_38679839
  1. 漫谈“数据湖”之价值与架构

  2. 本文主要介绍了数据湖是什么以及相关的概念,有什么特点及数据湖架构。本文来自公众号《韩锋频道》,由火龙果软件Anna编辑、推荐。数据湖这一概念,最早是在2011年由CITOResearch网站的CTO和作家DanWoods首次提出。其比喻是:如果我们把数据比作大自然的水,那么各个江川河流的水未经加工,源源不断地汇聚到数据湖中。业界便对数据湖一直有着广泛而不同的理解和定义。“数据湖是一个集中化存储海量的、多个来源,多种类型数据,并可以对数据进行快速加工,分析的平台,本质上是一套先进的企业数据架构。”
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:260096
    • 提供者:weixin_38557838
  1. “数据湖”:概念、特征、架构与案例

  2. 最近,数据湖的概念非常热,许多前线的同学都在讨论数据湖应该怎么建?阿里云有没有成熟的数据湖解决方案?阿里云的数据湖解决方案到底有没有实际落地的案例?怎么理解数据湖?数据湖和大数据平台有什么不同?头部的云计算玩家都各自推出了什么样的数据湖解决方案?带着这些问题,我们尝试写了这样一篇文章,希望能抛砖引玉,引起大家一些思考和共鸣。感谢南靖同学为本文编写了5.1节的案例,感谢西壁的review。本文包括七个小节:1、什么是数据湖;2、数据湖的基本特征;3、数据湖基本架构;4、各厂商的数据湖解决方案;5、
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:1048576
    • 提供者:weixin_38656142
  1. 数据湖应用解析:SparkonElasticsearch一致性问题

  2. Spark与Elasticsearch(es)的结合,是近年来大数据解决方案很火热的一个话题。一个是出色的分布式计算引擎,另一个是出色的搜索引擎。近年来,越来越多的成熟方案落地到行业产品中,包括我们耳熟能详的Spark+ES+HBase日志分析平台。目前,华为云数据湖探索(DLI)服务已全面支持Spark/Flink跨源访问Elasticsearch。而之前在实现过程中也遇到过很多场景化问题,本文将挑选其中比较经典的分布式一致性问题进行探讨。数据容错是大数据计算引擎面临的主要问题之一。目前,主流
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:181248
    • 提供者:weixin_38652058
  1. 开源数据湖方案选型:Hudi、Delta、Iceberg深度对比

  2. 其中,由于ApacheSpark在商业化上取得巨大成功,所以由其背后商业公司Databricks推出的delta也显得格外亮眼。ApacheHudi是由Uber的工程师为满足其内部数据分析的需求而设计的数据湖项目,它提供的fastupsert/delete以及compaction等功能可以说是精准命中广大人民群众的痛点,加上项目各成员积极地社区建设,包括技术细节分享、国内社区推广等等,也在逐步地吸引潜在用户的目光。ApacheIceberg目前看则会显得相对平庸一些,简单说社区关注度暂时比不上d
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:1048576
    • 提供者:weixin_38686557
  1. 亚马逊AWS数据湖是个什么鬼?

  2. 本文重点介绍了什么是数据胡,、数据湖与数据仓库的区别,AWS数据湖架构,如何构建数据湖等方面来介绍。本文来自谈数据,由火龙果软件Anna编辑、推荐。Datalake,我第一次接触这个概念,是在2014年IBM组织的数据治理交流论坛上。当时只是认为“数据湖”就是一个概念,没什么新意,“不就是把不同结构的数据实现统一存储,Hadoop不就是干这个活的吗?本质上还是换汤不换药、新瓶装老酒,又一个新概念”!后来发现,主流的大数据和云计算公司都在推这个叫“数据湖”的技术。于是,我特意上网百度了一下,“数据
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:693248
    • 提供者:weixin_38720173
  1. 数据湖|ApacheHudi设计与架构最强解读

  2. ApacheHudi(简称:Hudi)使得您能在hadoop兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。这两种原语分别是:Update/Delete记录:Hudi使用细粒度的文件/记录级别索引来支持Update/Delete记录,同时还提供写操作的事务保证。查询会处理最后一个提交的快照,并基于此输出结果。变更流:Hudi对获取数据变更提供了一流的支持:可以从给定的时间点获取给定表中已updated/inserted/deleted的所有
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:496640
    • 提供者:weixin_38640150
« 12 3 4 5 6 7 8 9 10 ... 14 »