文件名称:
hudi:大数据的增量和增量处理-源码
开发工具:
文件大小: 5mb
下载次数: 0
上传时间: 2021-02-16
详细说明:阿帕奇·胡迪
Apache Hudi(发音为Hoodie)代表Hadoop Upserts Deletes and Incrementals 。 Hudi管理DFS(云存储,HDFS或任何Hadoop FileSystem兼容存储)上的大型分析数据集的存储。
特征
支持快速插入索引的Upsert
通过回滚支持以原子方式发布数据
作者与查询之间的快照隔离
数据恢复的保存点
使用统计信息管理文件大小,布局
行和列数据的异步压缩
时间轴元数据以跟踪血统
通过聚类优化数据湖布局
Hudi支持三种查询类型:
快照查询-使用基于列和基于行的存储(例如 + )的组合,提供实时数据的快照查询。
增量查询-为变更流提供在某个时间点后插入或更新的记录。
读取优化查询-通过纯列存储(例如 )提供出色的快照查询性能。
通过了解有关Hudi的更多信息
从源代码构建Apache Hudi
构建Apach
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.