您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. hive和hbase整合

  2. 配置,测试,导入数据详细操作,CREATE TABLE hive_hbase_table(key int, value string,name string) hadoop jar /usr/lib/hbase/hbase-0.90.4-cdh3u3.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY, catgyname,catgyid1,catgyname1,catgyid2,catgyname2,catgyid3,catgyname3,catg
  3. 所属分类:Java

    • 发布日期:2013-10-30
    • 文件大小:22528
    • 提供者:u012625224
  1. hbase导入话单数据mapreduce函数实现执行过程实例(博客附件)

  2. 这是一篇博客的附件。 博客地址:http://blog.csdn.net/luckymelina/article/details/22889383
  3. 所属分类:Java

    • 发布日期:2014-04-03
    • 文件大小:36700160
    • 提供者:luckymelina
  1. sqoop-1.4.3.bin__hadoop-1.0.0 for linux免费下载

  2. sqoop-1.4.3.bin__hadoop-1.0.0 for linux免费下载 sqoop用于对数据进行导入导出 (1)把MySQL、Oracle等数据库中的数据导入到HDFS、Hive、HBase中 (2)把HDFS、Hive、HBase中的数据导出到MySQL、Oracle等数据库中
  3. 所属分类:其它

    • 发布日期:2016-02-04
    • 文件大小:4194304
    • 提供者:xq_iris
  1. nosql 入门教程

  2. 第一部分  NoSQL入门 第1章  NoSQL的概念及适用范围 2 1.1  定义和介绍 3 1.1.1  背景与历史 3 1.1.2  大数据 5 1.1.3  可扩展性 7 1.1.4  MapReduce 8 1.2  面向列的有序存储 9 1.3  键/值存储 11 1.4  文档数据库 14 1.5  图形数据库 15 1.6  小结 16 第2章  NoSQL上手初体验 17 2.1  第一印象——两个简单的例子 17 2.1.1  简单的位置偏好数据集 17 2.1.2  存储
  3. 所属分类:MySQL

    • 发布日期:2017-10-25
    • 文件大小:15728640
    • 提供者:u012296096
  1. sqoop安装详解以及sqoop介绍

  2. sqoop安装详解以及sqoop内容介绍使用介绍 集群介绍 sqoop:是一个工具,主要用于导入导出,实现MySQL到Hadoop之间数据的转换 2、导入数据:从结构化数据(Mysql,oracle,db2,)导入到半结构化或非结构化hadoop中(HDFS、HIVE、HBASE) 3、导出数据:从haoop中将数据导出到关系数据库中MySql
  3. 所属分类:MySQL

    • 发布日期:2018-07-04
    • 文件大小:1048576
    • 提供者:weixin_40126236
  1. 大型分布式网站架构与实践

  2. 第1章 面向服务的体系架构(SOA) 1   本章主要介绍和解决以下问题,这些也是全书的基础:   HTTP协议的工作方式与HTTP网络协议栈的结构。   如何实现基于HTTP协议和TCP协议的RPC调用,它们之间有何差别,分别适应何种场景。   如何实现服务的动态注册和路由,以及软负载均衡的实现。   1.1 基于TCP协议的RPC 3   1.1.1 RPC名词解释 3   1.1.2 对象的序列化 4   1.1.3 基于TCP协议实现RPC 6   1.2 基于HTTP协议的RPC 9
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:96468992
    • 提供者:mr_hope
  1. hbase导出csv,文本,html文件

  2. 通过条件查询hbase数据导出csv,文本,html等文件,实现方式:将hbase关联hive,然后将hive数据导入真实表,在将真实表数据导入sql数据库
  3. 所属分类:Hbase

    • 发布日期:2018-03-01
    • 文件大小:449536
    • 提供者:seashouwang
  1. hadoop笔记

  2. 史上最全hadoop笔记,组件描述 : 1. hdfs : 就是一个文件系统 ,可以存储海量的数据 2. mapreduce : 从海量数据中 ,通过一定的算法 ,计算出有用信息 3. hive : 就是 sql 语句解释器 ,接收用户输入的 sql 语句 ,然后将该 sql 语句翻译成复杂的 mapreduce 程序 ,并发布到 mr 集群中进行运行 ,也是计算出有用的信息 4. hbase : mysql 是基于 linux/windows 的文件系统的数据库 ,而 hbase 就是基于
  3. 所属分类:Hadoop

    • 发布日期:2018-10-26
    • 文件大小:114294784
    • 提供者:qq_42964050
  1. 2017最新大数据架构师精英课程

  2. 本资源为大数据基础到中高级教学资源,适合稍微有点大数据或者java基础的人群学习,资源过大,上传乃是下载链接,不多说,上目录: 1_java基础2 l3 a2 a$ t7 J2 b+ `- p 2_java引入ide-eclipse 3_java基础知识-循环-类型转换 4_循环-函数-数组-重载 5_多为数组-冒泡-折半-选择排序 6_oop-封装-继承-static-final-private 7_多态-接口-异常体系 8_适配器/ k% N! Y7 j/ |- c) O5 M' V6 S
  3. 所属分类:Java

  1. 大数据基础知识培训

  2. HDFS:类似Google GFS的分布式文件系统 MapRedce:并行计算架构,将计算任务拆分成大量可以独立运行的子任务,接着并行运算,另外会有一个系统调度的架构负责收集和汇总每个子任务的分析结果 HBase: 类似Google BigTable的分布式列式数据库,与Pig/Hive很好地集成 Pig:一种轻量级的脚本语言,在处理半结构化数据上拥有非常高的性能,为用户提供多种接口 Hive:数据仓库工具,在使用类SQL查询分析时显示是极高的性能,由Facebook贡献,定义了简单的类SQL
  3. 所属分类:Hadoop

    • 发布日期:2018-11-30
    • 文件大小:9437184
    • 提供者:hickwall2008
  1. 分布式列式数据库IndexR.zip

  2. IndexR 是一个专注于大数据实时分析的分布式列式数据库,它基于HDFS,能快速分析海量结构化数据,支持实时导入并且查询秒级延迟,特别适合ad-hoc场景下的OLAP查询。IndexR 具体实现参考并使用了众多优秀的开源项目,比如 Infobright,Hbase,Druid,Drill 等,与 Hadoop 生态圈深度结合。目前它主要通过作为 Apache Hive 和 Apache Drill 的插件来使用。IndexR 是由广州舜飞信息科技有限公司开发。 标签:IndexR
  3. 所属分类:其它

    • 发布日期:2019-07-17
    • 文件大小:747520
    • 提供者:weixin_39840387
  1. 大数据简历,内含有数据项目的简历,大数据 简历

  2. 大数据详细项目简历: 离线项目:于用户行为标签的智能气象服务系统 个人职责: 1.运用Flume采集源数据,存放于Kafka消息队列中 2.采用Kstream框架对数据进行初步数据清洗与变换,使用Java API将数据导入HBase 3.使用Hive集成Hbase,对数据进行ETL,进一步清洗处理数据 4.协助使用Hive提取特征值,运用Spark ML构建模型 5.参与模型检验与随机森林算法调优 6.参与编写脚本文件将数据导出到MySQL中,运用Tableau工具进行可视化分析 参与编写部分O
  3. 所属分类:互联网

    • 发布日期:2020-04-28
    • 文件大小:31744
    • 提供者:qq_46359356
  1. atlas_cn-master.zip

  2. atlas是一个用在hadoop上的数据治理和元数据框架工具。它是基于hadoop平台上,能无缝对接hadoop平台的组件。前端UI默认使用solr5,有丰富的rest API ,后端数据库可以是hive,hbase等。能导入不同格式的数据源,包括hive,hbase等 atlas官方中文文档,其中图片部分可对照官方网站进行查阅.
  3. 所属分类:IT管理

    • 发布日期:2020-02-12
    • 文件大小:3145728
    • 提供者:t18092838767
  1. 2.企业级大数据分析平台.pdf

  2. 让大家将所学到的大数据理论付诸于实践中。。。。。。。Lanate 企业级 hadoop高可用HDFS集群 zooKeeper Insemble-Instances Typically Reside on Master Nodes Zookeeper zooKeeper zookeeper Journalnode Zookeeper Failove Failover Controller Controller Must Res de o Journalnode Must Reside on t h
  3. 所属分类:spark

    • 发布日期:2019-10-08
    • 文件大小:1048576
    • 提供者:hyperz1988
  1. sqoop工具_202006041735481.docx

  2. Apache Sqoop(SQL-to-Hadoop) 项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。 用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统 (如HBase 和Hive)中;同时也可以把数据从 Hadoop 系统里抽取并导出到关系型数据库里。除了这些主要的功能 外,Sqoop 也提供了一些诸如查看数据库表等实用的小工具。理论上,Sqoop 支持任何一款支持 JDBC 规范的数据库,如 DB2、MySQL 等。Sq
  3. 所属分类:其它

    • 发布日期:2020-06-04
    • 文件大小:400384
    • 提供者:JINtian04
  1. Hive数据导入HBase的方法.docx

  2. HIVE建表时可以指定映射关系直接读取HBASE的数据,相当于有了一个HBASE向HIVE的通道。那HIVE向HBASE有通道吗?本文主要讲述了Hive库数据如何入到HBASE中。
  3. 所属分类:Hbase

    • 发布日期:2020-08-19
    • 文件大小:113664
    • 提供者:wubin9507
  1. HBase 数据库检索性能优化策略

  2. HBase 数据表介绍   HBase 数据库是一个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于 Google 的非开源数据库”BigTable”。   HDFS 为 HBase 提供底层存储支持,MapReduce 为其提供计算能力,ZooKeeper 为其提供协调服务和 failover(失效转移的备份操作)机制。Pig 和 Hive 为 HBase 提供了高层语言支持,使其可以进行数据统计(可实现多表 join 等),Sqoop 则为其提供 RDB
  3. 所属分类:其它

    • 发布日期:2020-12-14
    • 文件大小:328704
    • 提供者:weixin_38678498
  1. 大数据实验报告对应我的第二篇博客

  2. 一、大数据平台的搭建 3 1. 架构设计 6 2 服务器集群的搭建 7 (1)安装Linux操作系统、 14 (2)安装大数据处理框架Hadoop 20 3 工具软件安装 21 (1)安装关系型数据库MySQL 26 (2)安装列族数据库HBase 27 (3)安装Zookeepper 28 (4)安装数据仓库Hive 29 (5)安装Sqoop 32 (6)安装Eclipse 33 二、数据导入 34 1. 数据库、表清单 34 2. 数据对象的定义 37 (1) 创建数据库 39 (2) 创
  3. 所属分类:Hadoop

    • 发布日期:2020-12-30
    • 文件大小:8388608
    • 提供者:qq_45557681
  1. HBase数据库检索性能优化策略

  2. HBase数据库是一个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于Google的非开源数据库”BigTable”。HDFS为HBase提供底层存储支持,MapReduce为其提供计算能力,ZooKeeper为其提供协调服务和failover(失效转移的备份操作)机制。Pig和Hive为HBase提供了高层语言支持,使其可以进行数据统计(可实现多表join等),Sqoop则为其提供RDBMS数据导入功能。HBase不能支持where条件、Orderby查询,只
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:359424
    • 提供者:weixin_38645865
  1. HBase数据库检索性能优化策略

  2. HBase数据库是一个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于Google的非开源数据库”BigTable”。HDFS为HBase提供底层存储支持,MapReduce为其提供计算能力,ZooKeeper为其提供协调服务和failover(失效转移的备份操作)机制。Pig和Hive为HBase提供了高层语言支持,使其可以进行数据统计(可实现多表join等),Sqoop则为其提供RDBMS数据导入功能。HBase不能支持where条件、Orderby查询,只
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:359424
    • 提供者:weixin_38713099
« 12 »