您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Sparkify-Project-源码

  2. Sparkify项目工作区 一个Apache Spark大数据项目-预测将要从Web服务流失的用户 该项目是Udacity纳米学位计划“数据科学”的一部分。 检查此以获取更多信息。 此外:请查看我的中等博客文章 内容 Spark-大数据框架 为什么Spark是大数据分析的强大工具? 除Hadoop外,Spark目前是用于大数据分析的最受欢迎的工具之一。 尽管某些公司仍在使用Hadoop,但Hadoop是一种稍老的技术。 Spark通常比Hadoop快,这就是为什么Spark在最近几年变得越来
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:1048576
    • 提供者:weixin_42134144
  1. Udacity-Data-Engineering-Project-2:使用Redshift的云数据仓库-源码

  2. 项目:云数据仓库 音乐流初创公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 该项目旨在创建一个ETL管道,该管道从S3提取数据,在Redshift中进行分级,然后将数据转换为一组维度表,供分析团队使用,以继续寻找用户正在收听的歌曲的见解。 样本数据 地点 S3链接用于歌曲和日志的数据集: 歌曲数据: s3://udacity-de
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:79872
    • 提供者:weixin_42113456
  1. Project-4-AWS-Data-Lake-源码

  2. 数据湖 介绍 音乐流初创公司Sparkify进一步扩大了用户群和歌曲数据库,并希望将其数据仓库移至数据湖。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 我建立了一个ETL管道,该管道从S3提取数据,使用Spark进行处理,并将数据作为一组维表加载回S3。 这将使他们的分析团队能够继续发现用户正在听哪些歌曲的见解。 项目描述 在此项目中,我为S3上托管的数据湖构建了ETL管道。 数据从S3加载,使用Spark处理
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:4096
    • 提供者:weixin_42121725
  1. dend-project-3:Udacity数据工程纳米学位项目3:具有S3和Redshift的AWS ETL管道-源码

  2. | | 2020-11-23 项目3:AWS数据仓库 音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 他们要求数据工程师建立一个ETL管道,该管道从S3提取数据,在Redshift中进行分级,然后将数据转换为一组维度表,供其分析团队使用,以继续寻找用户正在收听的歌曲的见解。 通过运行Sparkify分析团队提供给您的
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:62464
    • 提供者:weixin_42125826
  1. postgres-data-modeling-project:Udacity数据工程纳米学位的第一个项目-源码

  2. Udacity数据工程纳米学位课程 项目:使用Postgres进行数据建模 介绍 一家名为Sparkify的初创公司是一个音乐流应用程序。 他们需要分析他们收集的数据。 数据-json格式的文件,用于记录用户活动和歌曲的元数据。 为了实现此目标,我们创建了一个Postgres数据库和一个ETL管道,该管道使用Python和SQL将文件中的数据传输到该数据库中。 数据库 为了满足Sparkify的分析重点,我们使用星型模式构建数据库。 事实表 'songplays'-来自与歌曲播放相关的日志数据
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:476160
    • 提供者:weixin_42097668
  1. Udacity-Project-Sparkify-Project-源码

  2. Udacity-Project-Sparkify-Project
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:158720
    • 提供者:weixin_42131342