nyc-taxi-data-pipeline
关于项目
纽约出租车的数据管道历史数据
此存储库提供脚本,用于下载和预处理从纽约市开始的过去三年中数十亿次出租车的数据。原始数据来自纽约市出租车和豪华轿车委员会的
建于
Python
火花
空气流动
入门
先决条件
如果不存在,请下载Docker
指示
执行docker build -t myimage . docker文件所在目录中的命令
执行docker run -d -p 8080:8080 myimage命令⋅⋅⋅此命令构建和包含Airflo