使用Postgres进行数据建模
罗德里戈·科埃略(Rodrigo Coelho)
介绍
这是Udacity数据工程纳米学位的项目。 在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力
概括
应用所有ETL步骤以为Sparkify提供星型模式模型。 选择了启动模式,因为它是最易于分析的模型之一。 总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。 歌曲和日志数据。 歌曲数据可提供歌曲和艺术