您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hive开发资料中文版

  2. Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语 言:HQL,能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。 本文讲解如何搭建一个Hive平台。假设 我们有3台机器:hadoop1,hadoop2,hadoop3。并且都安装好了Hadoop-0.19.2(hive支持的Hadoop版本很 多),hosts文件配置正确。Hive部署在hadoop1机器上。
  3. 所属分类:Java

    • 发布日期:2011-05-11
    • 文件大小:694272
    • 提供者:whycoder
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. Hadoop分布式云盘系统

  2. 基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘包括查看文件列表,多文件上传,创建文件夹,文件重命名、复制与移动、下载、在线浏览、分享等诸多功能。所使用的技术包括:SpringMVC框架、Spring框架、Maven项目管理工具、Hadoop
  3. 所属分类:Hadoop

    • 发布日期:2018-04-03
    • 文件大小:120586240
    • 提供者:x_uhen
  1. 大型分布式网站架构与实践

  2. 第1章 面向服务的体系架构(SOA) 1   本章主要介绍和解决以下问题,这些也是全书的基础:   HTTP协议的工作方式与HTTP网络协议栈的结构。   如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别,分别适应何种场景。   如何实现服务的动态注册和路由,以及软负载均衡的实现。   1.1 基于TCP协议的RPC 3   1.1.1 RPC名词解释 3   1.1.2 对象的序列化 4   1.1.3 基于TCP协议实现RPC 6   1.2 基于HTTP协议的RPC 9
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:96468992
    • 提供者:mr_hope
  1. Hadoop分布式云盘系统

  2. 基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘包括查看文件列表,多文件上传,创建文件夹,文件重命名、复制与移动、下载、在线浏览、分享等诸多功能。所使用的技术包括:SpringMVC框架、Spring框架、Maven项目管理工具、Hadoop
  3. 所属分类:Hadoop

    • 发布日期:2018-10-26
    • 文件大小:52428800
    • 提供者:xmt1139057136
  1. cdh6.1.0搭建手册.pdf

  2. CDH是Cloudera公司推出的基于稳定版本的Apache Hadoop构建,是Hadoop众多分支中的一种。 CDH提供了Hadoop的核心元素 - 可扩展的存储和分布式计算 - 以及基于Web的用户界面和重要的企业功能。 CDH是Apache许可的开放源码,是唯一提供统一批处理,交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解决方案。 Cloudera作为一个强大的商业版数据中心管理工具,提供了各种能够快速稳定运行的数据计算框架,如Apache Spark;使用Apache
  3. 所属分类:互联网

    • 发布日期:2020-04-01
    • 文件大小:3145728
    • 提供者:weixin_44160803
  1. 2.企业级大数据分析平台.pdf

  2. 让大家将所学到的大数据理论付诸于实践中。。。。。。。Lanate 企业级 hadoop高可用HDFS集群 zooKeeper Insemble-Instances Typically Reside on Master Nodes Zookeeper zooKeeper zookeeper Journalnode Zookeeper Failove Failover Controller Controller Must Res de o Journalnode Must Reside on t h
  3. 所属分类:spark

    • 发布日期:2019-10-08
    • 文件大小:1048576
    • 提供者:hyperz1988
  1. Hive系统集群搭建

  2. Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql查询功能,可以将sql语句转换 为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL 语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。cd/ etchive/ conf my hive-env sh template hive-env sh mv hive-default. xml template hive-
  3. 所属分类:Hive

    • 发布日期:2019-07-02
    • 文件大小:441344
    • 提供者:abacaba
  1. kubernetes handbook

  2. 最全的使用手册。记录了从零开始学习kubernetes的心路历程。着重于经验分享及总结。同时也会有相关概念解析。ConfigMap 2.3.15 ConfigMap的热更新 2.3.15 Horizontal Pod Autoscaling 2.3.16 Label 2.3.17 垃圾收集 2.3.18 NetworkPolicy 2.3.19 Annotation 2.3.20 用户指南 用户指南 3.1 资源对象配置 3.2 配置Pod的 liveness和 readiness探针 3.2.
  3. 所属分类:kubernetes

    • 发布日期:2019-03-02
    • 文件大小:38797312
    • 提供者:cqkey
  1. 基于 Hadoop 数据仓库的搭建

  2. 基于 Hadoop 数据仓库的搭建 为什么需要数据仓库?        传统的数据库中,存放的数据较多是一些定制性数据,表是二维的,一张表可以有很多字段,字段一字排开,对应的数据就一行一行写入表中,特点就是利用二维表表现多维关系。        但这种表关系的上限和下限就定死了,比如 QQ 的用户信息,直接通过查询 info 表,对应的 username、introduce 等信息即可,而此时我想知道这个用户在哪个时间段购买了什么?修改信息的次数?诸如此类的指标时,就要重新设计数据库的表结构,因
  3. 所属分类:其它

    • 发布日期:2020-12-14
    • 文件大小:119808
    • 提供者:weixin_38520046
  1. 基于 Hadoop 数据仓库的搭建

  2. 基于 Hadoop 数据仓库的搭建 为什么需要数据仓库?        传统的数据库中,存放的数据较多是一些定制性数据,表是二维的,一张表可以有很多字段,字段一字排开,对应的数据就一行一行写入表中,特点就是利用二维表表现多维关系。        但这种表关系的上限和下限就定死了,比如 QQ 的用户信息,直接通过查询 info 表,对应的 username、introduce 等信息即可,而此时我想知道这个用户在哪个时间段购买了什么?修改信息的次数?诸如此类的指标时,就要重新设计数据库的表结构,因
  3. 所属分类:其它

    • 发布日期:2020-12-14
    • 文件大小:119808
    • 提供者:weixin_38677806
  1. HiveSQL的编译过程

  2. 1、Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的HiveETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中,我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力,在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug,也有利于我们优化HiveSQL,
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:1041408
    • 提供者:weixin_38740201
  1. HiveSQL的编译过程

  2. 1、Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的HiveETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中,我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力,在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug,也有利于我们优化HiveSQL,
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:1041408
    • 提供者:weixin_38670531
  1. 基于Hive数据仓库的物流大数据平台的研究与设计

  2. 针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析,提出物流数据仓库的具体实现方案,该数据仓库结合云平台虚拟化技术,部署了 Hadoop和 Hive 环境,搭建了基于虚拟化技术的大数据处理平台。同时从数据 ETL 和数据查询分析处理两方面对数据仓库的可扩展性Hive 数据存储分析、Hive数据前置处理等进行研究设计。通过 Hive数据仓库运行效果进行分析,表明该系统能够很好地支持企业管理层决策。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:1048576
    • 提供者:weixin_38685600