您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Sparkify_Spark-源码

  2. Sparkify_Spark 概括 音乐流启动公司的数据驻留在S3中。 S3目录包含用户活动的JSON日志以及应用程序上歌曲的JSON元数据。 构建了ETL管道以从S3提取数据,使用Spark进行处理,并作为一组维度表加载回S3,以允许分析运行查询和分析数据。 维度表以星型模式进行组织,以方便业务用户进行简单而快速的查询。 通过事实表可以清楚地找到联接路径。 使用AWS EMR将ETL流程部署在群集上。 歌曲数据: 歌曲数据:s3:// udacity-dend / song_data
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:4096
    • 提供者:weixin_42168341