您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 论SparkStreaming的数据可靠性和一致性

  2. 摘要:眼下大数据领域最热门的词汇之一便是流计算了,而其中最耀眼的无疑是来自Spark社区的SparkStreaming项目。对于流计算而言,最核心的特点毫无疑问就是它对低时的需求,但这也带来了相关的数据可靠性问题。由于流计算系统是长期运行、且不断有数据流入,因此其Spark守护进程(Driver)的可靠性至关重要,它决定了Streaming程序能否一直正确地运行下去。Driver实现HA的解决方案就是将元数据持久化,以便重启后的状态恢复。如图一所示,Driver持久化的元数据包括:Block元数
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:466944
    • 提供者:weixin_38657835