StockMarketDataPipeline
概述
该项目的目的是为股票市场分析师提供一个公共数据库,以查询,分析数据并将其转换为可行的见解。 该应用程序使用Apache Airflow启动Python ETL脚本,该脚本获取Amazon S3的存储桶中以JSON和CSV格式存储的数据。 数据管道利用python从S3读取数据,创建数据并将其插入Redshift上托管的表中。 拥有适当凭据的任何人都可以访问redshift数据库和表。
源数据
该项目基于在Kaggle上找到的历史库存数据。 数