文件名称:
StockMarketDataPipeline-源码
开发工具:
文件大小: 117kb
下载次数: 0
上传时间: 2021-03-11
详细说明:StockMarketDataPipeline
概述
该项目的目的是为股票市场分析师提供一个公共数据库,以查询,分析数据并将其转换为可行的见解。 该应用程序使用Apache Airflow启动Python ETL脚本,该脚本获取Amazon S3的存储桶中以JSON和CSV格式存储的数据。 数据管道利用python从S3读取数据,创建数据并将其插入Redshift上托管的表中。 拥有适当凭据的任何人都可以访问redshift数据库和表。
源数据
该项目基于在Kaggle上找到的历史库存数据。 数据包括1970-2018年间来自纽约证券交易所和纳斯达克的几千种股票报价器的每日股票价格,并以1.5 gb的csv文件大小存储。 无法以允许精确十进制计算的方式解析数据,因此提供了浮点数。 您可以在此处找到数据集: :
使用的工具
Python
SQL
S3由于具有可伸缩性并支持多种文件格式
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.