搜索资源 - 基于Hadoop数据仓库的搭建 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 基于Hadoop数据仓库的搭建

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

hive开发资料中文版
Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。本文讲解如何搭建一个Hive平台。假设我们有3台机器：hadoop1,hadoop2,hadoop3。并且都安装好了Hadoop-0.19.2（hive支持的Hadoop版本很多），hosts文件配置正确。Hive部署在hadoop1机器上。
所属分类：Java
- 发布日期：2011-05-11
- 文件大小：694272
- 提供者：whycoder

实战Hadoop：开启通向云计算的捷径
第1章神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发参考文献第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
所属分类：其它
- 发布日期：2013-07-31
- 文件大小：61865984
- 提供者：jsntghf

Hadoop分布式云盘系统
基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库，采用SpringMVC+Spring框架实现，包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘包括查看文件列表，多文件上传，创建文件夹，文件重命名、复制与移动、下载、在线浏览、分享等诸多功能。所使用的技术包括：SpringMVC框架、Spring框架、Maven项目管理工具、Hadoop
所属分类：Hadoop
- 发布日期：2018-04-03
- 文件大小：120586240
- 提供者：x_uhen

大型分布式网站架构与实践
第1章　面向服务的体系架构（SOA） 1 　　本章主要介绍和解决以下问题，这些也是全书的基础：　　HTTP协议的工作方式与HTTP网络协议栈的结构。　　如何实现基于HTTP协议和TCP协议的RPC调用，它们之间有何差别，分别适应何种场景。　　如何实现服务的动态注册和路由，以及软负载均衡的实现。　　1.1　基于TCP协议的RPC 3 　　1.1.1　RPC名词解释 3 　　1.1.2　对象的序列化 4 　　1.1.3　基于TCP协议实现RPC 6 　　1.2　基于HTTP协议的RPC 9
所属分类：Java
- 发布日期：2018-08-24
- 文件大小：96468992
- 提供者：mr_hope

Hadoop分布式云盘系统
基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库，采用SpringMVC+Spring框架实现，包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘包括查看文件列表，多文件上传，创建文件夹，文件重命名、复制与移动、下载、在线浏览、分享等诸多功能。所使用的技术包括：SpringMVC框架、Spring框架、Maven项目管理工具、Hadoop
所属分类：Hadoop
- 发布日期：2018-10-26
- 文件大小：52428800
- 提供者：xmt1139057136

cdh6.1.0搭建手册.pdf
CDH是Cloudera公司推出的基于稳定版本的Apache Hadoop构建，是Hadoop众多分支中的一种。 CDH提供了Hadoop的核心元素 - 可扩展的存储和分布式计算 - 以及基于Web的用户界面和重要的企业功能。 CDH是Apache许可的开放源码，是唯一提供统一批处理，交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解决方案。 Cloudera作为一个强大的商业版数据中心管理工具，提供了各种能够快速稳定运行的数据计算框架，如Apache Spark；使用Apache
所属分类：互联网
- 发布日期：2020-04-01
- 文件大小：3145728
- 提供者：weixin_44160803

2.企业级大数据分析平台.pdf
让大家将所学到的大数据理论付诸于实践中。。。。。。。Lanate 企业级 hadoop高可用HDFS集群 zooKeeper Insemble-Instances Typically Reside on Master Nodes Zookeeper zooKeeper zookeeper Journalnode Zookeeper Failove Failover Controller Controller Must Res de o Journalnode Must Reside on t h
所属分类：spark
- 发布日期：2019-10-08
- 文件大小：1048576
- 提供者：hyperz1988

Hive系统集群搭建
Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的 sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL 语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。cd/ etchive/ conf my hive-env sh template hive-env sh mv hive-default. xml template hive-
所属分类：Hive
- 发布日期：2019-07-02
- 文件大小：441344
- 提供者：abacaba

kubernetes handbook
最全的使用手册。记录了从零开始学习kubernetes的心路历程。着重于经验分享及总结。同时也会有相关概念解析。ConfigMap 2.3.15 ConfigMap的热更新 2.3.15 Horizontal Pod Autoscaling 2.3.16 Label 2.3.17 垃圾收集 2.3.18 NetworkPolicy 2.3.19 Annotation 2.3.20 用户指南用户指南 3.1 资源对象配置 3.2 配置Pod的 liveness和 readiness探针 3.2.
所属分类：kubernetes
- 发布日期：2019-03-02
- 文件大小：38797312
- 提供者：cqkey

基于 Hadoop 数据仓库的搭建
基于 Hadoop 数据仓库的搭建为什么需要数据仓库？传统的数据库中，存放的数据较多是一些定制性数据，表是二维的，一张表可以有很多字段，字段一字排开，对应的数据就一行一行写入表中，特点就是利用二维表表现多维关系。但这种表关系的上限和下限就定死了，比如 QQ 的用户信息，直接通过查询 info 表，对应的 username、introduce 等信息即可，而此时我想知道这个用户在哪个时间段购买了什么？修改信息的次数？诸如此类的指标时，就要重新设计数据库的表结构，因
所属分类：其它
- 发布日期：2020-12-14
- 文件大小：119808
- 提供者：weixin_38520046

基于 Hadoop 数据仓库的搭建
基于 Hadoop 数据仓库的搭建为什么需要数据仓库？传统的数据库中，存放的数据较多是一些定制性数据，表是二维的，一张表可以有很多字段，字段一字排开，对应的数据就一行一行写入表中，特点就是利用二维表表现多维关系。但这种表关系的上限和下限就定死了，比如 QQ 的用户信息，直接通过查询 info 表，对应的 username、introduce 等信息即可，而此时我想知道这个用户在哪个时间段购买了什么？修改信息的次数？诸如此类的指标时，就要重新设计数据库的表结构，因
所属分类：其它
- 发布日期：2020-12-14
- 文件大小：119808
- 提供者：weixin_38677806

HiveSQL的编译过程
1、Hive是基于Hadoop的一个数据仓库系统，在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建，每天执行近万次的HiveETL计算流程，负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中，我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力，在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug，也有利于我们优化HiveSQL，
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：1041408
- 提供者：weixin_38740201

HiveSQL的编译过程
1、Hive是基于Hadoop的一个数据仓库系统，在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建，每天执行近万次的HiveETL计算流程，负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中，我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力，在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug，也有利于我们优化HiveSQL，
所属分类：其它
- 发布日期：2021-02-02
- 文件大小：1041408
- 提供者：weixin_38670531

基于Hive数据仓库的物流大数据平台的研究与设计
针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析，提出物流数据仓库的具体实现方案，该数据仓库结合云平台虚拟化技术，部署了 Hadoop和 Hive 环境，搭建了基于虚拟化技术的大数据处理平台。同时从数据 ETL 和数据查询分析处理两方面对数据仓库的可扩展性Hive 数据存储分析、Hive数据前置处理等进行研究设计。通过 Hive数据仓库运行效果进行分析，表明该系统能够很好地支持企业管理层决策。
所属分类：其它
- 发布日期：2021-01-27
- 文件大小：1048576
- 提供者：weixin_38685600