您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Kylo为企业级的数据湖赋能

  2. Kylo作为开源数据湖DataLake的解决方案,对企业进行数据湖DataLake实施进行了相关介绍,包括Kylo是如何解决业务人员与IT人员之间的鸿沟,如何构建基于数据湖驱动的企业文化和数据民主进行了阐述。
  3. 所属分类:互联网

    • 发布日期:2017-02-26
    • 文件大小:140288
    • 提供者:kaizhao_kz
  1. Kylo v0.8.3 documentation PDF

  2. Kylo是一个基于Apache Hadoop和Spark的全功能数据湖平台。Kylo is a full-featured Data Lake platform built on Apache Hadoop and Spark. Kylo provides a turn-key, business-friendly Data Lake solution enabling data ingest, data preparation, and data discovery.
  3. 所属分类:Hadoop

    • 发布日期:2017-09-27
    • 文件大小:8388608
    • 提供者:quguang65265
  1. The Definitive Guide to the Data Lake

  2. 从数据仓库技术到数据湖技术,国外对数据湖技术的讨论越来越激烈,本篇文章来自国外网站上的搜集
  3. 所属分类:IT管理

    • 发布日期:2018-01-09
    • 文件大小:3145728
    • 提供者:rose_424
  1. Azure Data Lake

  2. 从数据仓库技术到数据湖技术,国外对数据湖技术的讨论越来越激烈,本篇文章来自国外网站上的搜集,主要介绍微软Azure 的数据湖技术
  3. 所属分类:IT管理

    • 发布日期:2018-01-09
    • 文件大小:312320
    • 提供者:rose_424
  1. bi and analytics on a data lake the definitive guide

  2. BI技术基于数据湖进行数据分析,这是一篇指引性的文档
  3. 所属分类:IT管理

    • 发布日期:2018-01-09
    • 文件大小:1048576
    • 提供者:rose_424
  1. Data Lake vs. Data Warehouse Is the warehouse going under the lake

  2. 在技术框架选择方面是要构建企业数据库还是数据仓库,文章里有一些阐述
  3. 所属分类:IT管理

    • 发布日期:2018-01-09
    • 文件大小:26624
    • 提供者:rose_424
  1. PwC-Data lakes and the promise of unsiloed data

  2. 四大之一的普华永道对数据湖的能力成熟的进行了描述说明
  3. 所属分类:IT管理

    • 发布日期:2018-01-09
    • 文件大小:998400
    • 提供者:rose_424
  1. Practical Enterprise Data Lake Insights

  2. Data explosion was something that companies used to hear but never questioned their ability to handle it. Data was merely used to maintain a system of record of an event. However, multiple studies discussed the potential of data in decision making a
  3. 所属分类:算法与数据结构

    • 发布日期:2018-07-04
    • 文件大小:4194304
    • 提供者:windstand
  1. Three Architecture Styles for a Useful Data Lake.pdf

  2. DataLake: Three Architecture Styles for a Useful Data Lake
  3. 所属分类:企业管理

    • 发布日期:2019-09-03
    • 文件大小:1048576
    • 提供者:hspecial
  1. simple-datalake-client-源码

  2. simple-datalake-client
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:71680
    • 提供者:weixin_42098104
  1. Datalake-Independecia:Django creado para la munisipalidad de indeptendencia-源码

  2. Datalake独立 Django creado para la munisipalidad de indeptendencia
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:25165824
    • 提供者:weixin_42157166
  1. datalake-源码

  2. 数据湖演示 使用Dataproc模板在Dataproc上编排Spark
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:3072
    • 提供者:weixin_42132352
  1. Udacity-Datalake-Spark:具有Spark的Udacity数据湖-源码

  2. Sparkify的Data Lake ELT流程 概括 介绍 该项目将为Sparkify提取歌曲和日志数据,以使其更易于理解其数据并对该数据进行分析。 该项目正在使用EMR将数据处理到S3上。 入门 该ELT过程是一个非常简单的过程。 如果这是您第一次运行此项目,则应复制dl.cfg.example文件,并为项目dl.cfg配置参数。 然后在您的本地计算机上: python main.py 该过程将检查目标存储桶是否存在。 如果存在,则该进程将删除存储桶以及该存储桶中的所有内容,然后在s3上
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:510976
    • 提供者:weixin_42133680
  1. 初探数据湖(DataLake),到底有什么用?让我们来一窥究竟...

  2. 数据湖的概念最早是2011年提出来的,最初数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。关于数据湖的定义,维基百科上是这样讲的:数据湖(DataLake)是一个以原
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:822272
    • 提供者:weixin_38736721
  1. 数据湖(DataLake)-剑指下一代数据仓库

  2. 数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。数据湖正在成为一种越来越流行的大数据解决方案,而数据湖这个词已经被大数据供应商赋予了太多不同的含义,如果有什么工作是传
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:311296
    • 提供者:weixin_38637805
  1. DeltaLake_Experiment:DataLake实验和教程-源码

  2. DeltaLake_Experiment:DataLake实验和教程
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:1048576
    • 提供者:weixin_42131405
  1. datalake-etl-pipeline:使用Apache Spark的Hadoop中简化的ETL过程。 具有用于datalake的完整ETL管道。 SparkSession扩展,DataFrame验证,列扩展,SQL函数和DataFra

  2. Datalake ETL管道 简化了任何数据平台的数据转换。 Features:该软件包具有完整的ETL过程- 使用元数据,转换和数据模型信息来设计ETL管道 建立目标转换SparkSQL和Spark Dataframes 构建源和目标Hive DDL 验证DataFrames,扩展核心类,定义DataFrame转换并提供UDF SQL函数。 支持ETL管道的以下基本转换- 过滤源和目标数据框 在源和目标数据帧上进行分组和聚合 大量嵌套的查询/数据框 具有复杂且高度嵌套的XML,JS
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:754688
    • 提供者:weixin_42146230
  1. terraform-module-azure-datalake:用于Azure数据湖的Terraform模块-源码

  2. Terraform模块Azure数据湖 这是用于Terraform的模块,该模块在Microsoft Azure上部署了完整且可靠的数据湖网络。 组件 Azure数据工厂,用于从各种来源提取数据 Azure Data Lake Storage gen2容器存储数据Lake层的数据 Azure Databricks清理和转换数据 Azure Synapse Analytics存储演示数据 Azure CosmosDB存储元数据 凭据和访问管理已配置就绪 此设计基于Microsoft的一种解决方案的
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:50176
    • 提供者:weixin_42128015
  1. 数据湖(DataLake)-剑指下一代数据仓库

  2. 数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。 数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。数据湖正在成为一种越来越流行的大数据解决方案,而数据湖这个词已经被大数据供应商赋予了太多不同的含义,如果有什么工作是
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:311296
    • 提供者:weixin_38591291
  1. 初探数据湖(DataLake),到底有什么用?让我们来一窥究竟...

  2. 数据湖的概念最早是2011年提出来的,最初数据湖是数据仓库的补充,是为了解决数据仓库漫长的开发周期,高昂的开发、维护成本,细节数据丢失等问题出现的。 数据湖大多是相对于传统基于RDBMS的数据仓库,而从2011年前后,也就是数据湖概念出现的时候,很多数据仓库逐渐迁移到以Hadoop为基础的技术栈上,而且除了结构化数据,半结构化、非结构数据也逐渐的存储到数据仓库中,并提供此类服务。这样的数据仓库,已经具有了数据湖的部分功能。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:822272
    • 提供者:weixin_38721565
« 12 »