您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. SAP BW模型解析

  2. 传统的Cube:星型结构,由事实表和维度表组成,事实表存放的是业务数据以及它本身独有的信息和指向周围维表的外键,事实表的主键由维度键值组成;维表中存放的是特性值,由一个维度键值和多个维度属性组成. 改进的Cube:星型结构,由事实表、SID表(存放的是由系统自动为每个特性生成的SID码(4位整型值)和维度键值(4位整型值),其中SID码是主数据表中的主键)和主数据表组成;SID表中存放的不再是特性值,它存放的是SID码和维度键值(由系统自动生成),特性值存放在主数据表中.此时的维表包含SID表
  3. 所属分类:专业指导

    • 发布日期:2010-09-01
    • 文件大小:1024
    • 提供者:flyer826
  1. BI维度模型(IBM红皮书).pdf

  2. BI 维度模型 IBM红皮书 维表建设规范 事实表建设规范 BI架构 做BI值得参考!
  3. 所属分类:其它

    • 发布日期:2012-02-21
    • 文件大小:8388608
    • 提供者:javashooter
  1. 数据仓库-关于数据仓库维度数据处理的方法探究系列

  2. 维度是多维数据集的结构性特性。它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。(此概念引之于SQLServer2000联机帮助) 所有维度均直接或间接地基于表。当从某个表创建维度时,您会选择定义此维度的列。选择列的顺序至关重要,因为它将影响维度层次结构内成员的位置。(此概念引之于SQLServer2000联机帮助) 维度是有层次的,在大多数情况下维度的成员会按金字塔形布局排列。水平布局由维度层次结构中具有相同
  3. 所属分类:其它

    • 发布日期:2012-07-10
    • 文件大小:285696
    • 提供者:xzq2001888
  1. 数据仓库维度表更新技术分析

  2. 要想在百度八亿网页的数据海洋中找到你所要的信息, 人工方式需要1200 多人年,而百度搜索技术不到1 秒钟。人 们被数据淹没,却渴望知识。商务智能技术已成为当今企业 获取竞争优势的源泉之一。商务智能通常被理解为将企业中 现有的数据转化为知识,帮助企业做出明智决策的IT工具集。 其中数据仓库、OLAP和数据挖掘技术是商务智能的重要组成 部分。商务智能的关键在于如何从众多来自不同企业运作系 统的数据中,提取有用数据,进行清理以保证数据的正确性, 然后经过抽取、转换、装载合并到一个企业级的数据仓库里
  3. 所属分类:其它

    • 发布日期:2012-07-10
    • 文件大小:891904
    • 提供者:xzq2001888
  1. ETL复习资料

  2. "数据集市(Data Mart) ,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。 每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索
  3. 所属分类:其它

    • 发布日期:2012-11-01
    • 文件大小:315392
    • 提供者:hq050622
  1. 数据仓库与商务智能最佳实践

  2. 译者序   前言   作者简介   第一部分准备   第1章数据仓库和商务智能概述   1.1商务智能概述   1.1.1定义   1.1.2商务智能的价值   1.1.3剖析商务智能   1.1.4商务智能的成功要素   1.1.5商务智能的目标   1.1.6BI用户展现层   1.1.7BI工具和架构   1.1.8全球化带来的发展   1.2数据仓库概述   1.2.1定义   1.2.2数据仓库系统   1.2.3数据仓库架构   1.2.4数据流术语   1.2.5数据仓库目标  
  3. 所属分类:Oracle

    • 发布日期:2014-05-19
    • 文件大小:36700160
    • 提供者:zouxian
  1. 维度建模指南

  2. 关于维度建模的指导书,通过各个维度和事实表分析业务,组合数据仓库
  3. 所属分类:其它

    • 发布日期:2015-01-15
    • 文件大小:4194304
    • 提供者:albert2007
  1. 事实表维度表设计

  2. 事实表维度表设计
  3. 所属分类:算法与数据结构

    • 发布日期:2017-07-26
    • 文件大小:275456
    • 提供者:luyangbai
  1. 事实表维度表基本解释

  2. 事实表维度表基本解释
  3. 所属分类:算法与数据结构

    • 发布日期:2017-07-26
    • 文件大小:994304
    • 提供者:luyangbai
  1. 数据仓库工具箱:维度建模完全指南

  2. 讲述维度建模的方法,基本常用的事实、维度表的结构
  3. 所属分类:专业指导

    • 发布日期:2009-03-25
    • 文件大小:4194304
    • 提供者:xminton
  1. Hbase、Hive的整合教案.txt

  2. 个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的 " 层次 " 区域,这些被分解的表都连接到主维度表而不是事实表
  3. 所属分类:Hive

    • 发布日期:2019-07-24
    • 文件大小:5120
    • 提供者:weixin_43860144
  1. Data-Modeling-with-Postgres-源码

  2. 要求:设计一个数据仓库来存储有关不同用户正在播放的所有歌曲的数据。这个想法是使数据适合于分析。 解决方案: 创建一个具有4个维度表和一个事实表的数据仓库:用户-用户维度及其属性Songs-歌曲维度及其属性artist-艺术家维度及其属性time-time维度及其属性songplays-在事实表中播放所有歌曲系统以及指向不同维度的链接 将数据插入数据仓库 该解决方案包含以下文件: sql_queries.py:包含删除和创建数据库对象所需的所有sql查询,以及将数据插入表中的插入查询。 cre
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:4096
    • 提供者:weixin_42170064
  1. Datawarehouse-源码

  2. 数据仓库 介绍 在这个项目中,一家名为Sparkify的新兴公司正在成长,仅通过迁移到云中就可以满足其数据库需求。数据工程团队的任务是建立ETL管道,该管道从S3中的JSON日志中提取信息,并从其应用程序中提取JSON元数据,并将其持久化到托管在AWS Redshift上的PostgresSQL DB。 架构图 有一个事实表(歌曲播放)和四个维度表(歌曲,用户,艺术家和时间) 在Redshift上实现数据库的步骤 在sql_queries.py中为每个表写出CREATE / DROP SQL语句
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:4096
    • 提供者:weixin_42131790
  1. Data-Warehouse-with-Amazon-Redshift-and-S3:项目03-源码

  2. 项目描述 音乐流应用启动公司Sparkify希望通过分析和查找相关模式来利用他们从应用中收集的歌曲和用户数据。特别是,分析团队希望知道用户正在听的歌曲。但是,在当前设置中,很难理解数据。最近,该应用程序的用户基础以及歌曲数据库不断增长,并希望将其流程和数据转移到云中。到目前为止,他们的数据位于Amazon s3存储桶中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上具有JSON元数据的目录中,根本不适合进行查询。该项目的目标是创建一个ETL管道,该管道从S3提取数据,
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:241664
    • 提供者:weixin_42131618
  1. DataModelingUdacity:Trabalho光纤数据建模Udacity-当前数据工程-源码

  2. •••• 关于 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 在该项目中,基于事实表和四个维度创建了一个星型模型,以分析用户正在收听哪些歌曲的信息。 苏玛莉 该项目具有以下文件 test.ipynb->显示每个表的前几行,以便您检查数据库。 create_tables.py->删除并创建表。 每次运行ETL脚本之前,您都运行此文件以重置表。 etl.ipynb->从song_
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:60416
    • 提供者:weixin_42169245
  1. ETL_FOR_INSERT_DATA-源码

  2. ETL_FOR_INSERT_DATA 介绍 一家名为Sparkify的初创公司希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 分析团队对了解用户正在收听的歌曲特别感兴趣。 目的是创建一个Postgres数据库架构和ETL管道来优化歌曲播放分析的查询。 项目描述 在这个项目中,我必须使用Postgres建模数据,并使用Python构建和ETL管道。 在数据库方面,我必须为“星型模式”定义事实和维度表以得到特定的关注。 另一方面,ETL管道将使用Python和SQL将位于两
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:7168
    • 提供者:weixin_42099176
  1. CMS-Project:为CMS Healthcare数据集创建了数据仓库,其中包括与医生,教学医院和与保险公司有关的付款相关的信息。 使用有助于将它们连接起来的密钥(邮政编码)链接所有不同的数据集。 之后,根据分析后获得的见解创建不同的摘

  2. CMS项目 为CMS Healthcare数据集创建了数据仓库,其中包括与医生,教学医院和与保险公司有关的付款相关的信息。 使用有助于将它们连接起来的密钥(邮政编码)链接所有不同的数据集。 之后,根据分析后获得的见解创建不同的摘要表。 可视化汇总表,有助于决策过程。 根据汇总表创建报告以得出见解,诸如各州医疗保险支付问题的模式,基于收入群体的医师分配,医院和医师的支出,寻找改善保险公司收入系统的方式和方法。 我根据疾病和感染率确定了需要适当分配医生的主要领域。 开发了与每个事件的支出相关的摘
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:4194304
    • 提供者:weixin_42128141
  1. Udacity数据工程-源码

  2. 数据工程纳米学位 Udacity在DEND纳米学位中开发的项目和资源。 项目1:关系数据库-使用PostgreSQL进行数据建模。 使用PostgreSQL开发了一个关系数据库,以对音乐流应用程序的用户活动数据进行建模。 技能包括:使用PostgreSQL创建关系数据库使用事实和维度表的优化定义开发星型数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 经验包括:Python,PostgreSql,Star Schema,ETL管道,规范化 项目2:NoSQL数据库
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:4194304
    • 提供者:weixin_42129005
  1. Skytrax-Data-Warehouse:完整的数据仓库基础架构,其ETL管道在Apache Airflow的docker上的docker内部运行,用于数据编排,AWS Redshift用于云数据仓库,以及Metabase,可满足数据可

  2. Skytrax数据仓库 完整的数据仓库基础架构,其ETL管道在Apache Airflow上的docker上的docker内部运行,用于数据编排,用于云数据仓库的AWS Redshift和用于满足数据可视化需求(例如分析仪表板)的Metabase。 建筑 数据仓库包括以下各个模块: 总览 数据是从 获得的。 收集的数据存储在本地磁盘上,并及时移至AWS S3上的Landing Bucket。 ETL作业是用SQL编写的,并且以气流的形式进行调度,以每小时运行一次,以保持云数据仓库中数据的新鲜度
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42162216
  1. Udacity-Data-Engineering:Udacity数据工程纳米学位(DEND)-源码

  2. 数据工程纳米学位 Udacity在开发的项目和资源。 项目1: 。 使用PostgreSQL开发了一个关系数据库,以对音乐流应用程序的用户活动数据进行建模。 技能包括: 使用PostgreSQL创建一个关系数据库 使用事实和维度表的优化定义开发了一个Star Schema数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 能力包括:Python,PostgreSql,Star Schema,ETL管道,规范化 项目2: 。 根据项目一中概述的原始架构,使用Apa
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:1048576
    • 提供者:weixin_42097369
« 12 3 »