您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ibm数据仓库架构之二

  2. IBM TDW Sales Overview 18-Jun-02.ppt
  3. 所属分类:C/C++

    • 发布日期:2009-12-29
    • 文件大小:2097152
    • 提供者:python2004
  1. 腾讯TDW用户手册(海量数据仓库)

  2. 数据仓库者可以学习参考,这是大公司搞数据仓库的话必备书籍!不要错过哦 下了就不会后悔滴
  3. 所属分类:其它

    • 发布日期:2012-01-14
    • 文件大小:2097152
    • 提供者:moumouguoguo
  1. 腾讯分布式数据仓库TDW解析

  2. 腾讯分布式数据仓库TDW解析,百度下载的,百度需要两元钱哦。
  3. 所属分类:其它

    • 发布日期:2014-05-14
    • 文件大小:1048576
    • 提供者:dengxy012586
  1. 郭玮:TDW在Hadoop上的实践分享

  2. 腾讯是一个巨无霸公司,我们日常的生活中已与它产生了千丝万缕的联系,不可避免的也产生了海量的数据,如何正确而快速地处理这些海量数据,腾讯数据平台高级架构师郭玮通过发表主题为“TDW在Hadoop上的实践分享”的演讲,向大家分享了腾讯处理超大规模数据的经验。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:hehaihe220
  1. 赵伟:HIVE在腾讯分布式数据仓库实践

  2. 赵伟首先介绍了他们的TDW核心架构,HIVE,MapReduce,HDFS及PostgreSQL构成。赵伟分享了最核心的HIVE模块在TDW中的实践经验;HIVE是一个在Hadoop上构建数据仓库的软件,它支持通过类SQL的HQL语言对结构化数据进行操作;实现了基本的SQL功能,可扩充UDF/UDAF...
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:fowse
  1. 赵伟:Hive在腾讯分布式数据仓库实践分享

  2. 本演讲对Hive在腾讯内部最大的数据处理系统——腾讯分布式数据仓库中的应用做以分享。Hive存在哪些性能问题,腾讯是怎么解决的?在研发历时约三年后的今天,Hive在TDW中的应用现状是怎样的,未来是怎样的?本演讲将对问题作一个明晰的阐释。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:admin
  1. 肖磊:腾讯个性化推荐系统设计及实现

  2. 腾讯数据中心数据挖掘研究员肖磊在SDCC 2013第二天的开放平台“大数据分析与BI专题论坛”上发表了题为《腾讯个性化推荐系统设计及实现》的演讲。肖磊最后总结说,腾讯个性化推荐系统的设计基于两大核心平台:腾讯分布式数据仓库(TDW)、实时推荐平台(APOLLO)。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:2097152
    • 提供者:u010933980
  1. 大数据开放日-深圳-TDW-protobuf存储格式功能介绍-马淑婧

  2. 为普及大数据相关知识,促进广州、深圳地区大数据爱好者的交流,增强企业使用大数据相关开源项目的意识,特地举办了“大数据开放日”深圳活动。 本活动由 CSDN CODE与腾讯大讲堂联合主办,活动同时得到了CSDN战略合作伙伴腾讯公司、腾讯云、腾讯基金会的大力支持。 活动详情:http://code.csdn.net/news/2819519
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:1048576
    • 提供者:tuhaihe
  1. 大数据开放日-深圳-TDW与PostgreSQL数据互访问功能-李巍

  2. 为普及大数据相关知识,促进广州、深圳地区大数据爱好者的交流,增强企业使用大数据相关开源项目的意识,特地举办了“大数据开放日”深圳活动。 本活动由 CSDN CODE与腾讯大讲堂联合主办,活动同时得到了CSDN战略合作伙伴腾讯公司、腾讯云、腾讯基金会的大力支持。 活动详情:http://code.csdn.net/news/2819519
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:910336
    • 提供者:tuhaihe
  1. 从TDW-Hive到TDW-Spark-SQL_ 腾讯TDW数据引擎演进之路

  2. 腾讯TDW平台的介绍与应用。 数据引擎由TDW-Hive切换到TDW-Spark-SQL的实践。 TDW-Spark-SQL的功能完善,高可用和稳定性加强,性能和成本优化经验分享。
  3. 所属分类:Java

    • 发布日期:2016-08-15
    • 文件大小:2097152
    • 提供者:taobai021
  1. 腾讯TDW用户手册(海量数据)

  2. TDW数据仓库需要提供海量数据(PB级)的存储能力和大数据量(TB级)的计算能力。这就要求TDW尽可能的进行分布式存储和并行执行计算操作,从而提高性能和可扩展性。 TDW的存储和计算引擎都采用share-nothing(SN)结构,SN意味着更少的竞争,这样就可以获得更好的线性扩展能力。随着业务量和数据量的增长,增加节点就可以提高整个系统的存储和计算能力。SN结构是支持分布式存储和并行计算的最优结构,具有共享资源少、系统开销小、加速比高等优点和近似线性的可扩充性,符合TDW分布式数据仓库的设计
  3. 所属分类:算法与数据结构

    • 发布日期:2018-07-19
    • 文件大小:878592
    • 提供者:qq_21870555
  1. 海量数据处理的大杀器-腾讯分布式数据仓库(TDW)

  2. 腾讯公司的海量数据处理平台 腾讯分布式数据仓库(TDW) TDW的技术点分享 TDW技术发展展望
  3. 所属分类:Hadoop

    • 发布日期:2018-02-07
    • 文件大小:3145728
    • 提供者:qq_37879547
  1. 腾讯TDW用户手册(海量数据)-40页

  2. TDW数据仓库需要提供海量数据(PB级)的存储能力和大数据量(TB级)的计算能力。这就要求TDW尽可能的进行分布式存储和并行执行计算操作,从而提高性能和可扩展性。 TDW的存储和计算引擎都采用share-nothing(SN)结构,SN意味着更少的竞争,这样就可以获得更好的线性扩展能力。随着业务量和数据量的增长,增加节点就可以提高整个系统的存储和计算能力。SN结构是支持分布式存储和并行计算的最优结构,具有共享资源少、系统开销小、加速比高等优点和近似线性的可扩充性,符合TDW分布式数据仓库的设计
  3. 所属分类:算法与数据结构

    • 发布日期:2018-02-07
    • 文件大小:2097152
    • 提供者:qq_37879547
  1. tdw-glossary-1:可信数字网络词汇表(TDW-GMP)-源码

  2. tdw-glossary-1 可信数字网络词汇表(TDW-GMP)
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:394240
    • 提供者:weixin_42107491
  1. 腾讯大数据之TDW计算引擎解析——Shuffle

  2. 腾讯分布式数据仓库(TencentdistributedDataWarehouse,简称TDW)基于开源软件Hadoop和Hive进行构建,并且根据公司数据量大、计算复杂等特定情况进行了大量优化和改造,目前单集群最大规模达到5600台,每日作业数达到100多万,已经成为公司最大的离线数据处理平台。为了满足用户更加多样的计算需求,TDW也在向实时化方向发展,为用户提供更加高效、稳定、丰富的服务。TDW计算引擎包括两部分:一个是偏离线的MapReduce,一个是偏实时的Spark,两者内部都包含了一
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:640000
    • 提供者:weixin_38727087
  1. Spark在腾讯数据仓库TDW的应用

  2. 为了满足挖掘分析与交互式实时查询的计算需求,腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查询计算,目前腾讯大数据拥有超过200台的Spark集群,并独立维护Spark和Shark分支。Spark集群已稳定运行2年,积累了大量的案例和运营经验能力,另外多个业务的大数据查询与分析应用,已在陆续上线并稳定运行。在SQL查询性能方面普遍比MapReduce高出2倍以上,利用内存计算和内存表的特性,性能至少在10倍以上。在迭代计算与挖掘分析方面,精准推荐将小
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:334848
    • 提供者:weixin_38717980
  1. 腾讯TDW:大型Hadoop集群应用

  2. TDW(TencentdistributedDataWarehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万,每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,CP
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:340992
    • 提供者:weixin_38685521
  1. 腾讯大数据之TDW计算引擎解析——Shuffle

  2. 腾讯分布式数据仓库(TencentdistributedDataWarehouse,简称TDW)基于开源软件Hadoop和Hive进行构建,并且根据公司数据量大、计算复杂等特定情况进行了大量优化和改造,目前单集群最大规模达到5600台,每日作业数达到100多万,已经成为公司最大的离线数据处理平台。为了满足用户更加多样的计算需求,TDW也在向实时化方向发展,为用户提供更加高效、稳定、丰富的服务。TDW计算引擎包括两部分:一个是偏离线的MapReduce,一个是偏实时的Spark,两者内部都包含了一
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:640000
    • 提供者:weixin_38607311
  1. Spark在腾讯数据仓库TDW的应用

  2. 为了满足挖掘分析与交互式实时查询的计算需求,腾讯大数据使用了Spark平台来支持挖掘分析类计算、交互式实时查询计算以及允许误差范围的快速查询计算,目前腾讯大数据拥有超过200台的Spark集群,并独立维护Spark和Shark分支。Spark集群已稳定运行2年,积累了大量的案例和运营经验能力,另外多个业务的大数据查询与分析应用,已在陆续上线并稳定运行。在SQL查询性能方面普遍比MapReduce高出2倍以上,利用内存计算和内存表的特性,性能至少在10倍以上。在迭代计算与挖掘分析方面,精准推荐将小
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:334848
    • 提供者:weixin_38718307
  1. 腾讯TDW:大型Hadoop集群应用

  2. TDW(Tencent distributedDataWarehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。TDW服务覆盖了腾讯绝大部分业务产品,单集群规模达到4400台,CPU总核数达到10万左右,存储容量达到100PB;每日作业数100多万,每日计算量4PB,作业并发数2000左右;实际存储数据量80PB,文件数和块数达到6亿多;存储利用率83%左右,C
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:340992
    • 提供者:weixin_38621897
« 12 »