文件名称:
streamx:kafka-connect-s3:从Kafka到对象存储(s3)提取数据-源码
开发工具:
文件大小: 247kb
下载次数: 0
上传时间: 2021-01-30
详细说明:基于安全问题,已计划此REPO SEC故障单#SEC-2988
StreamX:Kafka Connect for S3
从很棒的
StreamX是基于kafka连接的连接器,用于将数据从Kafka复制到对象存储,例如Amazon s3,Google Cloud Storage和Azure Blob存储。 它专注于可靠和可扩展的数据复制。 它可以以不同的格式(如镶木地板)写出数据,以便分析工具可以轻松使用它,也可以满足不同的分区要求。
##产品特点 :
StreamX从kafka-connect-hdfs继承了丰富的功能集。
支持以Avro和Parquet格式写入数据。
提供Hive集成,其中连接器创建分区的Hive表,并在向S3写入新分区后定期添加分区
可插分区器:
默认分区程序:每个Kafka分区将其数据复制到特定于分区的目录下
基于时间的分区器:能够按小时写入数据
基于字段的分区程序:能够将记录中的字段用作自定义分区程序
除了这些,我们还对以下内容进行了更改,以使其能够与s3一起有效地工作
使用WAL一次保证
支持将Hive表存储在Qubole的Hive Metast
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.