项目描述
音乐流应用启动公司Sparkify希望通过分析和查找相关模式来利用他们从应用中收集的歌曲和用户数据。特别是,分析团队希望知道用户正在听的歌曲。但是,在当前设置中,很难理解数据。最近,该应用程序的用户基础以及歌曲数据库不断增长,并希望将其流程和数据转移到云中。到目前为止,他们的数据位于Amazon s3存储桶中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上具有JSON元数据的目录中,根本不适合进行查询。该项目的目标是创建一个ETL管道,该管道从S3提取数据,