您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 百度数据工厂在流式数据处理的应用与实践

  2. 百度数据工厂整合了各种解决方案,目的就是提供一个一站式的数据处理平台。 百度数据工厂最原先用 Hive 引擎,进行离线批量数据分析和 PB 级别的查询,处理一些核心报表数据。但是在推广过程中发现,用户其实还是有复杂分析、实时处理、数据挖掘的请求,现在则以 Spark 为基础做了统一的一个计算引擎,以前 Hive 的一套也完全融入到 Spark 里来;包括多种提交方式;安全管理等等。最后形成一套完整的成品。
  3. 所属分类:spark

    • 发布日期:2019-06-30
    • 文件大小:735232
    • 提供者:longlongriver