您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Datawarehouse-源码

  2. 数据仓库 介绍 在这个项目中,一家名为Sparkify的新兴公司正在成长,仅通过迁移到云中就可以满足其数据库需求。数据工程团队的任务是建立ETL管道,该管道从S3中的JSON日志中提取信息,并从其应用程序中提取JSON元数据,并将其持久化到托管在AWS Redshift上的PostgresSQL DB。 架构图 有一个事实表(歌曲播放)和四个维度表(歌曲,用户,艺术家和时间) 在Redshift上实现数据库的步骤 在sql_queries.py中为每个表写出CREATE / DROP SQL语句
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:4096
    • 提供者:weixin_42131790
  1. DataWarehouse:带有Redshift的数据仓库-源码

  2. 数据仓库 带有Redshift的数据仓库 用于各种数据仓库项目的ETL管道。 可以在项目文件夹中看到每个项目的详细说明
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:560128
    • 提供者:weixin_42181319
  1. data-systems:演示和动手教程,关于现代数据系统-源码

  2. 数据系统概论 该存储库包含一组有关巴黎南硕士课程的Data Lake课程的演示文稿和动手教程。 我决定打开此模块的内容以: 使任何想要学习数据工程的人都可以使用它 通过公开和开放供稿来提高模块的质量 内容 简报: 涵盖: 什么是大数据 从DataWarehouse到Data Lake 数据处理架构: Lambda架构和kappa架构 HDFS的设计目标和概念 HDFS中的数据操作说明数据存储格式简介: avro , orc和parquet 数据整合问题 什么是write ahead l
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:4194304
    • 提供者:weixin_42121725
  1. poc_aws_datawarehouse-源码

  2. POC数据仓库 Objetivo 数据仓库和数据仓库的竞争者 Validar arquitetura sugerida parainjestãode dados Desenho das Arquiteturas(que estou validandoatéentão) 没有数据流的理想情况,没有数据流,没有安装S3(数据湖)格式的镶木地板。 O GLUEéuma ferramenta de ETL,compare pretendo catalogue e separar os dados
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:78848
    • 提供者:weixin_42116672
  1. 火箭电梯-源码

  2. 火箭电梯-机器学习 第12周-机器学习 视频展示: : 特征 - Datawarehouse; - Relational database; - Interventions form; - Admin panel (backoffice); - Multiple fully fonctional apis; - Rake tasks to fully operate the databases; - Fully operational postman collection to test t
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:97517568
    • 提供者:weixin_42139302
  1. DataWarehouse:数据仓库和用户画像-源码

  2. DataWarehouse:数据仓库和用户画像
  3. 所属分类:其它

    • 发布日期:2021-01-28
    • 文件大小:3145728
    • 提供者:weixin_38737565