您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hive-0.10.0

  2. 数据仓库hive-0.10.0的程序,与hadoop搭配使用
  3. 所属分类:其它

    • 发布日期:2013-06-08
    • 文件大小:35651584
    • 提供者:chenxinyucs
  1. 实战Hadoop:开启通向云计算的捷径

  2. 第1章 神奇的大象——Hadoop 1.1 初识神象 1.2 Hadoop初体验 1.2.1 了解Hadoop的构架 1.2.2 查看Hadoop活动 1.3 Hadoop族群 1.4 Hadoop安装 1.4.1 在Linux系统中安装Hadoop 1.4.2 在Windows系统中安装Hadoop 1.4.3 站在象背上说“hello” 1.4.4 Eclipse下的Hadoop应用开发 参考文献 第2章 HDFS——不怕故障的海量存储 2.1 开源的GFS——HDFS 2.1.1 设计前
  3. 所属分类:其它

    • 发布日期:2013-07-31
    • 文件大小:61865984
    • 提供者:jsntghf
  1. 实战Hadoop--开启通向云计算的捷径 源代码

  2. 实战Hadoop--开启通向云计算的捷径 源代码 第1章 神奇的大象——Hadoop (无源码) 第2章 HDFS——不怕故障的海量存储 (源码下载) 第3章 分久必合——MapReduce (源码下载) 第4章 一张无限大的表——HBase (源码下载) 第5章 更上一层楼——MapReduce进阶 (无源码) 第6章 Hive——飞进数据仓库的小蜜蜂 (源码下载) 第7章 Pig——一头什么都能吃的猪 (源码下载) 第8章 Facebook的女神——Cassandra (源码下载) 第9章
  3. 所属分类:其它

    • 发布日期:2013-12-27
    • 文件大小:34603008
    • 提供者:u010489937
  1. hive-0.10.0.tar.gz

  2. hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行
  3. 所属分类:Java

    • 发布日期:2016-12-02
    • 文件大小:35651584
    • 提供者:meiyoujiaru
  1. nosql 入门教程

  2. 第一部分  NoSQL入门 第1章  NoSQL的概念及适用范围 2 1.1  定义和介绍 3 1.1.1  背景与历史 3 1.1.2  大数据 5 1.1.3  可扩展性 7 1.1.4  MapReduce 8 1.2  面向列的有序存储 9 1.3  键/值存储 11 1.4  文档数据库 14 1.5  图形数据库 15 1.6  小结 16 第2章  NoSQL上手初体验 17 2.1  第一印象——两个简单的例子 17 2.1.1  简单的位置偏好数据集 17 2.1.2  存储
  3. 所属分类:MySQL

    • 发布日期:2017-10-25
    • 文件大小:15728640
    • 提供者:u012296096
  1. 分布式数据仓库Hive大全

  2. 1. HIVE结构 6 1.1 HIVE架构 6 1.2 Hive 和 Hadoop 关系 7 1.3 Hive 和普通关系数据库的异同 8 1.4 HIVE元数据库 9 1.4.1 DERBY 9 1.4.2 Mysql 10 1.5 HIVE的数据存储 11 1.6 其它HIVE操作 11 2. HIVE 基本操作 12 2.1 create table 12 2.1.1 总述 12 2.1.2 语法 12 2.1.3 基本例子 14 2.1.4 创建分区 15 2.1.5 其它例子 16
  3. 所属分类:Java

    • 发布日期:2017-11-08
    • 文件大小:2097152
    • 提供者:u014407201
  1. VIP学院大数据培训第六期全套视频 (1).rar

  2. 第1天:开学+常见业务+MR 第2天:MR+Hive 第3天:Hive02_03 第4天:scala+spark 第5天:yarn和spark 第6天:LR+商品项目 第7天:数据采集业务+flume 第8天:实时采集kafka+SparkStreaming 第9天:Spark Streaming02+Flink 第10天:streaming补充+Flink 第11天:数据仓库 第12天:数据仓库+Hbase 第13天:协同过滤 第14天:结巴切词+基于内容推荐+项目作业 第15天:隐马HMM
  3. 所属分类:Hadoop

    • 发布日期:2019-05-09
    • 文件大小:305
    • 提供者:u011349099
  1. 数据仓库系统Shark.zip

  2. Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。 要求: Scala 2.10.3 AMPLab's Hive 0.11 Spark 0.9.x 标签
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:461824
    • 提供者:weixin_39840914
  1. 分布式大数据查询引擎 PrestoDB.zip

  2. Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。 Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。 Presto 的目标是在
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:22020096
    • 提供者:weixin_39840914
  1. greenplum-jdbc-5.1.4.000223.jar

  2. Greenplum是一个面向数据仓库应用的关系型数据库,它基于流行的PostgreSQL开发,因为有良好的体系结构,所以在数据存储,高并发,高可用,线性扩展,反应速度,易用性和性价比等方面有非常明显的优势,非常受欢迎.进入大数据时代以后,Greenplum的性能在TB级别数据量的表现上非常优秀,单机性能相比Hadoop要快上好几倍;在功能和语法上,要比Hadoop上的SQL引擎Hive好用很多,普通用户更加容易上手。2019-9-10更新最新连接Greenplum驱动,建议使用官方驱动,pos
  3. 所属分类:PostgreSQL

    • 发布日期:2019-09-10
    • 文件大小:1048576
    • 提供者:z645817
  1. 10-Hive数据仓库

  2. Hive数据仓库思维导图,便捷整理思路,Hive简介、Hive架构、Hive搭建:单用户模式、多用户模式
  3. 所属分类:Hive

    • 发布日期:2020-02-15
    • 文件大小:2097152
    • 提供者:weixin_43555997
  1. 大数技术据培训PPT.pptx

  2. 课时1:大数据技术介绍和RPC框架讲解 课时2:HDFS分布式文件存储系统 课时3:MapReduce计算框架和Yarn资源调度组件 课时4:列式存储数据库HBASE和资源协调组件Zookeeper 课时5:数据仓库HIVE 课时6:流式计算技术架构介绍 课时7:Kafka,Flink,ElasticSearch组件介绍(上) 课时8:Kafka,Flink,ElasticSearch组件介绍(下) 课时9:Spark组件介绍(一) 课时10:Spark组件介绍(二)
  3. 所属分类:flink

    • 发布日期:2020-01-13
    • 文件大小:12582912
    • 提供者:Anxin1984
  1. hive-1.1.0-cdh5.10.0.tar.gz

  2. Hive 大数据仓库 hive-1.1.0-cdh5.10.0.tar.gz
  3. 所属分类:群集服务

    • 发布日期:2020-08-04
    • 文件大小:125829120
    • 提供者:dgwlover209
  1. 项目实战——钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量(Java版本)

  2. 此篇文章主要选取关键性指标,数据校验数据源Hive和目标ES内的数据是否一致; 因为你不知道将Hive的数据导入到了ElasticSearch后,数据量是否准确,所以需要钉钉报警校验ElasticSearch和Hive数据仓库内的数据质量,注意,这个项目打包后,最好另起一个进程调用,并且开始时间为文章1或者2最大预估的结束时间后的10分钟后调用,这样可以校验两种情形: 1.ETL项目被调度了,但是造成了数据异常,可以捕捉到; 2.ETL项目压根就没起来,即超时了,造成了数据异常,亦可被捕捉!
  3. 所属分类:其它

    • 发布日期:2020-10-24
    • 文件大小:176160768
    • 提供者:LXWalaz1s1s
  1. 10-Hive数据仓库

  2. Hive数据仓库 Hive数据仓库思维导图下载链接 Hive简介 Hive的产生 非java编程者对HDFS的数据做Mapreduce操作 Hive : 数据仓库 Hive:解释器,编译器,优化器等 Hive 运行时,元数据存储在关系型数据库里面 Hive架构 (1)用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是CLI,Cli启动的时候,会同时启动一个Hive副本。Client是Hive的客户端,用户连接至Hive Server。在启动 Client模式的时候,需要指出Hi
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:59392
    • 提供者:weixin_38554193
  1. hiveMetaMgr:hive仓库元数据管理系统-源码

  2. #hive仓库元数据管理系统##有如下功能: 1.hive元数据信息的查看,包括表基本信息,数据库基本信息,分区信息,分区信息,索引信息等; 2.对hive元数据的检索,包括表,分段,数据库等内容的检索 3.元数据信息更新(目前只提供对库,表,分段的描述信息进行更新,通过两次双击相应分段可进行相应编辑); 4.对表数据或按分区进行预览 5.对表数据或按分区进行数据EXCEl格式导出 6.数据下载,直接从hdfs上下载原始数据,可以对整表或者分区进行下载 7.表或该表相应分区的删除(需要数据
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:35651584
    • 提供者:weixin_42120997
  1. 腾讯大规模Hadoop集群实践

  2. TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面,介绍了TDW在建设单个大规模集群中采取的JobTracker分散化和NameNode高可用两个优化方案。TDW(TencentdistributedDataWarehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:379904
    • 提供者:weixin_38608189
  1. 腾讯TDW:大型Hadoop集群应用

  2. TDW(TencentdistributedDataWarehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万,每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,CP
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:340992
    • 提供者:weixin_38685521
  1. 达观数据分析平台架构和Hive实践

  2. Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop的
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:498688
    • 提供者:weixin_38628626
  1. 达观数据分析平台架构和Hive实践

  2. Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励以后。 近十年来,随着Hadoop生态系统的不断完善,Hadoop早已成为大数据事实上的行业标准之一。面对当今互联网产生的巨大的TB甚至PB级原始数据,利用基于Hadoop
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:498688
    • 提供者:weixin_38731479
« 12 »