直流电
条款
有向无环图(DAG):具有节点,有向边和无环的一个分支。
应用程序可编程接口(API):
在线交易流程(OLTP):面向行
联机分析过程(OLTP):面向列,存储在数据仓库中
提取变换负载(ETL)
提取:从1个以上来源获取数据
转换:使用并行计算执行转换
加载:将数据加载到目标数据库中
并行计算框架
火花
避免磁盘写入(相对于Hadoop)
依靠弹性分布式数据集(RDD)
元组列表
转换方法:.map()、. filter()
动作:.count(),first()
工作流程安排