您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. spark集群部署及入门.docx

  2. 本文档适合spark 入门级人员参考学习,集群的搭建,集群环境测试!
  3. 所属分类:Java

    • 发布日期:2015-05-11
    • 文件大小:701440
    • 提供者:tu5213xf
  1. Spark入门.docx

  2. Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
  3. 所属分类:spark

    • 发布日期:2020-04-02
    • 文件大小:271360
    • 提供者:qq_32146369
  1. 大数据-数据仓库.docx

  2. 申明:只适用于基于hive搭建的大数据数仓,其他不要下载,谢谢,适用与想从事数仓架构师和数仓开发人员,或者想入门数据仓库开发的人,大数据开发想整体了解数仓只看这个就够了,项目中用到的整体规范文档,包括数仓的规范,日常开发规范,解释spark脚本规范,其中数仓分层,数仓的命名,都是项目中实际用到的落地方案
  3. 所属分类:Hive

    • 发布日期:2021-03-22
    • 文件大小:945152
    • 提供者:u012794992