文件名称:
lakeFS:对象存储的类似Git的功能-源码
开发工具:
文件大小: 4mb
下载次数: 0
上传时间: 2021-02-03
详细说明:什么是lakeFS
lakeFS是一个开源层,可为基于对象存储的数据湖提供弹性和可管理性。
借助lakeFS,您可以构建可重复的,原子的和版本化的数据湖操作-从复杂的ETL作业到数据科学和分析。
lakeFS支持将AWS S3或Google Cloud Storage作为其基础存储服务。 它与S3兼容,并且可以与所有现代数据框架(例如Spark,Hive,AWS Athena,Presto等)无缝协作。
有关更多信息,请参见。
能力
数据开发环境
实验-单独尝试工具,升级版本并评估代码更改。
可重现性-可以回到任何时间点来获得一致的数据湖版本。
持续数据整合
通过执行最佳实践来安全地摄取新数据-确保新数据源符合您湖中的最佳实践,例如格式和架构实施,命名约定等。
元数据验证-防止重大更改进入生产数据环境。
持续数据部署
即时恢复对数据的更改-如果您的消费者暴露了低质量的数据,则可以立即恢复到数据湖以前,一致且正确的快照。
增强交叉收集的一致性-向消费者提供必须以一种原子的,可恢复的动作同步的多个数据收集。
通过启用来防止数据质量问题
测试生产数据,然后再将其展示给用户
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.