文件名称:
pyspark-style-guide:这是一个PySpark代码样式指南,根据我们遇到的PySpark存储库中最频繁出现的主题,介绍了常见的情况和相关的最佳实践-源码
开发工具:
文件大小: 18kb
下载次数: 0
上传时间: 2021-03-18
详细说明:PySpark样式指南
PySpark是一种包装语言,它允许用户与Apache Spark后端进行交互以快速处理数据。 Spark可以在服务器的分布式网络上的海量数据集上运行,如果正确使用,则可以提供主要的性能和可靠性优势。即使PySpark语法汲取了Spark的JVM继承,因此也实现了可能不熟悉的代码模式,即使对于有经验的Python开发人员而言,也带来了挑战。
这份自以为是的PySpark代码风格指南介绍了我们遇到的常见情况以及基于PySpark存储库中最频繁重复出现的主题的最佳实践。
除了PySpark细节外,干净代码的常规做法在PySpark存储库中也很重要-Google 是了解更多有关这些做法的强力起点。
除隐含歧义外,首选隐式列选择直接访问
# bad
df = df . select ( F . lower ( df1 . colA ), F . upper ( df2 .
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.