您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ETL-Project-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:4194304
    • 提供者:weixin_42138716
  1. Data-Warehouse-with-Amazon-Redshift-and-S3:项目03-源码

  2. 项目描述 音乐流应用启动公司Sparkify希望通过分析和查找相关模式来利用他们从应用中收集的歌曲和用户数据。特别是,分析团队希望知道用户正在听的歌曲。但是,在当前设置中,很难理解数据。最近,该应用程序的用户基础以及歌曲数据库不断增长,并希望将其流程和数据转移到云中。到目前为止,他们的数据位于Amazon s3存储桶中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上具有JSON元数据的目录中,根本不适合进行查询。该项目的目标是创建一个ETL管道,该管道从S3提取数据,
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:241664
    • 提供者:weixin_42131618
  1. ETL-Project-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:220160
    • 提供者:weixin_42097189
  1. ETL-Project:ETL项目-源码

  2. ETL-Project:ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:41943040
    • 提供者:weixin_42152298
  1. ETL-project:请参阅README.md以获取项目的描述-源码

  2. ETL项目 团队成员:凯莉·格randint,曹一飞 数据集概述 迪士尼Plus电影/电视节目数据集:( ) 数据集元数据: 来源: : 收集方法:带有omdbapi的Python 数据集所有者:Raphael Fontes 建立日期:2020-04-14 上次更新时间:2020-05-16 当前版本:版本3 数据列摘要: imdb_id:每个节目的唯一Internet电影数据库ID title:每个节目的标题。 这些标题不是唯一的。 可能有重复的标题,其imdb_ids
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:5242880
    • 提供者:weixin_42138376
  1. Bootcamp-ETL-Project-源码

  2. 训练营-ETL-项目
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:107520
    • 提供者:weixin_42151373
  1. ETL-Project-源码

  2. ETL项目提案 詹妮·戴维斯(Jenni Davis),苏珊·法拉戈(Susan Farago),大卫·希门尼斯(David Jimenez),伊丽莎白·康威(Elizabeth Conway)和奥斯汀·奥莱(Austin Olea) 概括 目标观众: •我们的数据库将针对计划在科罗拉多州探险的露营爱好者。 数据库信息: •按地区确定科罗拉多州露营设施的位置。 •量化空间的可用性。 •突出显示预订所需的平均预订提前期。 •检索可用空间和指定为仅RV露营,仅帐篷露营或两者的可用空间的数量。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:3145728
    • 提供者:weixin_42128270
  1. ETL-Project-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:91136
    • 提供者:weixin_42108054
  1. music_lib:ETL项目-源码

  2. music_lib 音乐数据库项目(ETL) 团队成员 吉姆·本特利 张安娜 澳洲音乐产业 目的本项目的目的是获取澳大利亚音乐产业的音乐元数据。 仓库 该存储库包含: *****文件:summary.md *****这包括ETL项目的挑战和发现的摘要。 *****文件:music.ipynb *****这包括从data.csv文件(来自Kaggle)和Spotify API站点中提取,转换和加载(包括到数据的后继连接和加载) 。 *****文件:album.ipynb *****这包
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:23068672
    • 提供者:weixin_42139357
  1. ETL:项目ETL-源码

  2. ETL项目报告 提炼 变形 加载
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:551936
    • 提供者:weixin_42160425
  1. ETL-project-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:15728640
    • 提供者:weixin_42144201
  1. ETL-Project:项目二-源码

  2. ETL项目 ETL项目提案 团队成员: 拉斐尔·塞拉诺(Raphael Serrano) 斯沃巴比卡耶娜 托马斯·梅纳(Thomas Maina) 戴安娜·麦登科(Diana Madonko) 项目概况 我们感兴趣的问题是探索世界各地已出版的书籍和相关信息。 这些数据将能够帮助人们选择书籍,因为它将提供有关评级,可负担性以及其他影响他们选择的领域的更多信息。 摘录-拟议的数据来源 •数据位于何处? 卡格勒 Google图书•数据集格式是什么? CSV JSON•您将如何获取此数据
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:36700160
    • 提供者:weixin_42160645
  1. etl-monitor-frontend-源码

  2. CFE 项目设置 npm install 编译和热重装以进行开发 npm run serve 编译并最小化生产 npm run build 自定义配置 请参阅。
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:73728
    • 提供者:weixin_42120275
  1. project_2:Bootcampspot项目2-源码

  2. Netflix或Disney +和chill(ETL项目) Notebooks文件夹包含所有python代码 在运行任何代码之前,只需确保项目文件夹结构类似于: repo_root│├──笔记本│├──01_xxx-笔记本文件│├──02_xxx│├──03_xxx│└──xxx.py-python文件│ ├──资源│├──xxx.tsv-数据集文件│├──xxx.csv │└──xxx.sqlite│├──烧瓶│├──app.py│├──myfunc.py│├──kaggle.py │├──
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:35840
    • 提供者:weixin_42160376
  1. Redshift_Data_Warehouse:这是来自数据工程Udacity课程的项目3-源码

  2. 项目描述 音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及其应用程序中的歌曲上具有JSON元数据的目录中。 Sparkify希望数据工程师构建执行以下操作的ETL管道: - Extracts their data from S3 - Stages them in Redshift - Transforms data into a set of dimensional ta
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:189440
    • 提供者:weixin_42104366
  1. 灾难响应管道:Udacity纳米度的第二个项目-Datascience-源码

  2. 灾害响应管道项目 Github仓库 指示: 在项目的根目录中运行以下命令来设置数据库和模型。 运行ETL管道以清理数据并将其存储在数据库中python data/process_data.py data/disaster_messages.csv data/disaster_categories.csv data/DisasterResponse.db 运行用于训练分类器并保存python models/train_classifier.py data/DisasterResponse.d
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:23068672
    • 提供者:weixin_42143806
  1. 数据工程项目:与数据工程相关的项目文件-源码

  2. 数据工程项目 与数据工程相关的项目文件所有要求都在以“ 0”开头的文件夹中。 使用的工具和技术是: Microsoft SQL Server(DDL,DML) Informatica(ETL职位) Power BI(报告和仪表板) 由于访问受限,该项目主要包含快照和sql脚本,但它清楚地说明了其中涉及的所有方法。 仪表板文件“ 11_”是一个Power Bi文件,可以通过查看该文件来了解项目。
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:18874368
    • 提供者:weixin_42140625
  1. setl:一个仅适用于Spark的简单ETL框架works-源码

  2. 如果您是数据科学家或数据工程师,那么在进行ETL项目时可能听起来很熟悉: 在多个项目之间切换很麻烦 调试别人的代码是一场噩梦 花大量时间解决与业务无关的问题 SETL (发音为“ settle”)是由支持的Scala框架,可帮助您构建Spark ETL项目,模块化数据转换逻辑并加快开发速度。 使用SETL 在一个新项目中 您可以通过克隆开始工作。 在现有项目中 com.jcdecaux.setl setl_2.12 1.0.0
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:373760
    • 提供者:weixin_42099858
  1. covid-19:COVID-19大流行的全球和墨西哥数据集的数据ETL和分析-源码

  2. 新冠肺炎 该项目包含用于收集和转换全球和墨西哥数据的COVID-19大流行数据集的脚本。 它还包含解释ETL和EDA流程的示例。 以下是所包含脚本的摘要: step1_global.py-一个Python脚本,可以从Johns Hopkins存储库下载并合并数据集。 step1_mx.py-一个Python脚本,可下载墨西哥CSC文件和关联的.xlsx目录并将它们合并为新的CSV文件。 step2_global.py-一个Python脚本,其中包含几个函数,可用于创建图并从全局数据集中获
  3. 所属分类:其它

    • 发布日期:2021-01-31
    • 文件大小:104857600
    • 提供者:weixin_42131601
  1. mara-example-project-2:微型项目数据仓库示例,用于python项目统计数据,新项目模板-源码

  2. 玛拉示例项目 一个可运行的应用程序,演示了如何使用mara构建数据仓库。 将库和库与框架结合到一个项目中。 示例ETL将PyPi下载统计信息和GitHub回购活动度量标准集成到了更通用的Python项目活动统计信息中。 该存储库旨在用作新项目的模板。 示例:Python项目统计 该项目使用两个数据源: 在 (需要Google登录)上BigQuery数据集。 它包含每个单独的软件包下载以及项目和客户端属性。 BigQuery资料集位于 。 它几乎包含所有发生在Github存储库中的事件。
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:17825792
    • 提供者:weixin_42141437
« 12 3 4 5 6 7 8 9 10 »