您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于数据仓库和SOA的地学数据集成与应用的关键技术研究.nh

  2. 吉林大学博士论文 本文将地学领域迫切希望将多源、异构、分散、多维的地学数据集成起来 并提供应用服务作为研究对象,深入研究了实现地学空间数据集成与应用集成 两个层面的相关技术。主要包括地学空间数据仓库、地学数据ETL、一体化存 储的地学数据模型映射、多维地学空间数据立方体、SOA框架、服务模型映射、 空间数据与属性数据有机集成、基于知识的岩性判别和蒸发岩沉积韵律旋回、 基于服务的共享机制优化、空间数据分析等。本文的主要贡献有如下五个方面: 1.首次系统化地提出了从数据集成到应用集成、地学数据处理
  3. 所属分类:Web开发

    • 发布日期:2010-04-09
    • 文件大小:16777216
    • 提供者:solarhughie
  1. IBM元数据文档

  2. IBM元数据文档
  3. 所属分类:IT管理

    • 发布日期:2014-02-15
    • 文件大小:4194304
    • 提供者:alen_liu
  1. 数据仓库元数据和ETL

  2. 数据仓库学习的好东西,包括数据仓库的高级应用,元数据的作用和使用方法,以及ETL的介绍和使用,是数据仓库学习的非常好,快的一个PPT软件
  3. 所属分类:专业指导

    • 发布日期:2008-10-10
    • 文件大小:1048576
    • 提供者:leolyleo
  1. 四种数据ETL模式 完全刷新 镜像增量 事件增量 镜像比较

  2. 四种数据ETL模式 完全刷新 镜像增量 事件增量 镜像比较
  3. 所属分类:Java

    • 发布日期:2009-02-16
    • 文件大小:48128
    • 提供者:steven_200812
  1. SQL Power数据清洗工具DQguru

  2. SQL Power提供的数据清洗工具,用于大数据采集过程,此工具提供了丰富的方法来做数据清洗
  3. 所属分类:Hadoop

    • 发布日期:2018-07-04
    • 文件大小:20971520
    • 提供者:wangwenke2003
  1. 大数据ETL技术方案

  2. 本文档是我花钱买过来的,里面详细介绍了开源软件Kettle的安装与使用,通过此文档,可以了解到数据ETL的原理
  3. 所属分类:Hadoop

    • 发布日期:2018-07-05
    • 文件大小:3145728
    • 提供者:beicuige
  1. 粗浅的大数据etl工具的研究

  2. 大数据etl工具的研究,请联系作者免费分享。思维导图并不方便贴图,
  3. 所属分类:专业指导

    • 发布日期:2018-08-21
    • 文件大小:587776
    • 提供者:shishi521
  1. 大数据ETL工具的测试设计与实现_王冬敏.caj

  2. 大数据ETL工具的测试设计与实现_王冬敏.caj
  3. 所属分类:spark

    • 发布日期:2019-07-17
    • 文件大小:5242880
    • 提供者:zhaoyong719
  1. 面向数据仓库和数据挖掘的ETL设计与应用

  2. 设计了一个具有良好的可扩展性、通用性、友好的JSP操作界面和统一的元数据管理等特点的数据ETL系统。结合实例介绍了此系统在石化企业中的应用。
  3. 所属分类:其它

    • 发布日期:2020-10-26
    • 文件大小:177152
    • 提供者:weixin_38606404
  1. DATA8001Assignment1:该项目是CIT数据科学与分析学科课程的第一项任务-源码

  2. DATA8001分配1 该项目是CIT数据科学和分析学科课程的第一个任务。 DATA8001分配1 摘要DATA8001作业1占模块总成绩的50%。 从Canvas下载与您的学生证相对应的zip文件,然后将内容解压缩到本地作业文件夹中,并确保您的文件类似于图1。 图1-示例分配文件夹和文件分配部分(50%) 数据ETL – 10%清洁提供的数据集:data / R00000000_original.csv并另存为data / R00000000_processed.csv,并用您的CIT
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:64512
    • 提供者:weixin_42131798
  1. Spotify-API-data-ETL--源码

  2. Spotify-API-数据-ETL-
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:11264
    • 提供者:weixin_42102713
  1. 大数据ETL入门及实战.pdf

  2. gupo学院大数据教程
  3. 所属分类:Microsoft

  1. 数据同步-源码

  2. 数据同步 基于canal的client-adapter开发,抽离内部项目的rdb插件及支持rocketmq 同步代码canal-adapter + CanalRocketMQClientExample订阅MQ +策略 功能模块 全量数据ETL,DB-> DB 增量数据同步,DB-> Canal-> MQ-> Client 增加分布式ID插件leaf,用于ID生成 去做: 配置中心 增量数据 ddl处理 关于分布式ID需要将leaf-core上传至私服
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:95232
    • 提供者:weixin_42133899
  1. 面向大数据的分布式调度

  2. 前言:大数据的分布式调度是在进行数据ETL过程中起到了总体的承上启下的角色,整个数据的生产、交付、消费都会贯穿其中,本文从调度、分布式调度的特征展开,再对大数据调度个性化特征的一些阐述,由满足大数据使用的架构和业务场景的需求上娓娓道来,从实践的角度分享如何打造一个高可用、高效率、灵活性的大数据调度平台。从上个世纪50年代起,调度问题的研究就受到数学、运筹学、工程技术学等领域科学的重视[1],人们主要从数学的角度来研究调度问题,调度问题也同样被定义为”分配一组资源来执行一组任务”,以获得生产任务执
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:617472
    • 提供者:weixin_38649356
  1. PyLot:基于Web的IDE,用于在Python和服务器管理中编写ETL管道-源码

  2. 一个基于Web的IDE,用于用Python编写ETL管道。 对于大多数Python开发人员而言,在Jupyter节点手册中编写用于数据处理的代码是标准, PyLot旨在将相同的工作流引入Web并准备好代码部署,从而使您不必花费数小时就从Jupyter笔记本转换数据ETL管道生产代码,您可以计划在任何时候运行该代码,同时还可以跟踪服务器,您可以使用PyLot的Web终端进行访问。 功能路线图: 服务器运行状况监视器。 (部署到生产 :check_mark: ) 连接到服务器的Web终端。
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:5242880
    • 提供者:weixin_42098892
  1. zdh_web:大数据采集,抽取平台-源码

  2. 阅读更多 数据采集​​,处理,监控,调度,管理一体化平台 因本项目没有其他文档,请使用者及开发者详细阅读完本readme 文档,后期会以博客的形式对本项目进行详细功能说明 本平台主要目的 高效的进行数据采集,内置自己的大数据平台 统一数据管理,对数据进行高效分析及对外输出 通过工具完成大部分工作,减少开发者的工作量 降低使用者标准,通过拖拉拽实现数据的采集(任务依赖关系由自带调度完成-优势) 在线预览 用户名:zyc 密码:123456 服务器资源有限,界面只供预览,不包含数据处理部分,谢码友们
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:27262976
    • 提供者:weixin_42099530
  1. synch:将其他数据库中的数据同步到ClickHouse(集群)-源码

  2. 同步 介绍 将其他数据库中的数据同步到ClickHouse,当前支持postgres和mysql,并支持完整和增量ETL。 产品特点 完整数据etl和实时增量etl。 支持DDL和DML同步,当前支持DDL的add column , drop column和change column ,还完全支持DML。 电子邮件错误报告。 支持kafka和redis作为代理。 多个源数据库同时同步到ClickHouse。 支持ClickHouse MergeTree , CollapsingMerg
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:307200
    • 提供者:weixin_42151772
  1. covid-19:COVID-19大流行的全球和墨西哥数据集的数据ETL和分析-源码

  2. 新冠肺炎 该项目包含用于收集和转换全球和墨西哥数据的COVID-19大流行数据集的脚本。 它还包含解释ETL和EDA流程的示例。 以下是所包含脚本的摘要: step1_global.py-一个Python脚本,可以从Johns Hopkins存储库下载并合并数据集。 step1_mx.py-一个Python脚本,可下载墨西哥CSC文件和关联的.xlsx目录并将它们合并为新的CSV文件。 step2_global.py-一个Python脚本,其中包含几个函数,可用于创建图并从全局数据集中获
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:104857600
    • 提供者:weixin_42131601
  1. 面向大数据的分布式调度

  2. 前言:大数据的分布式调度是在进行数据ETL过程中起到了总体的承上启下的角色,整个数据的生产、交付、消费都会贯穿其中,本文从调度、分布式调度的特征展开,再对大数据调度个性化特征的一些阐述,由满足大数据使用的架构和业务场景的需求上娓娓道来,从实践的角度分享如何打造一个高可用、高效率、灵活性的大数据调度平台。 从上个世纪50年代起,调度问题的研究就受到数学、运筹学、工程技术学等领域科学的重视[1],人们主要从数学的角度来研究调度问题,调度问题也同样被定义为”分配一组资源来执行一组任务”,以获得生产任务
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:617472
    • 提供者:weixin_38500607
  1. 基于Hive数据仓库的物流大数据平台的研究与设计

  2. 针对物流企业数据仓库扩展性不好、运行自动化程度不高、处理大规模数据效果较差等问题。本文通过对Hive技术的物流数据仓库进行分析,提出物流数据仓库的具体实现方案,该数据仓库结合云平台虚拟化技术,部署了 Hadoop和 Hive 环境,搭建了基于虚拟化技术的大数据处理平台。同时从数据 ETL 和数据查询分析处理两方面对数据仓库的可扩展性Hive 数据存储分析、Hive数据前置处理等进行研究设计。通过 Hive数据仓库运行效果进行分析,表明该系统能够很好地支持企业管理层决策。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:1048576
    • 提供者:weixin_38685600
« 12 3 4 5 6 7 8 9 10 ... 50 »