您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MetroSTL-Esri-ETL-源码

  2. 地铁圣路易斯GIS数据管道 介绍 创建该脚本的目的是为了使Metro St Louis数据存储区对于AGOL实例和现场ArcGIS Enterprise实例保持最新。该脚本旨在将静态目录中的数据作为CSV文件提取并将其传输到存储在gdb中的地理数据集,然后更新本地当前文件gdb并将当前gdb中的所有文件发布到两个云中。 随着Apache Airflow的发展,静态文件目录的必要性以及最终调用它们的Cronjob将变得过时。相反,最终将发生在每个星期一,AirFlow将运行查询以通过Python运
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:117760
    • 提供者:weixin_42127835
  1. Data-Warehouse-with-Amazon-Redshift-and-S3:项目03-源码

  2. 项目描述 音乐流应用启动公司Sparkify希望通过分析和查找相关模式来利用他们从应用中收集的歌曲和用户数据。特别是,分析团队希望知道用户正在听的歌曲。但是,在当前设置中,很难理解数据。最近,该应用程序的用户基础以及歌曲数据库不断增长,并希望将其流程和数据转移到云中。到目前为止,他们的数据位于Amazon s3存储桶中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上具有JSON元数据的目录中,根本不适合进行查询。该项目的目标是创建一个ETL管道,该管道从S3提取数据,
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:241664
    • 提供者:weixin_42131618
  1. ETL-Project:ETL项目-源码

  2. ETL-Project:ETL项目
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:41943040
    • 提供者:weixin_42152298
  1. ETL:项目ETL-源码

  2. ETL项目报告 提炼 变形 加载
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:551936
    • 提供者:weixin_42160425
  1. ETL-Project:项目二-源码

  2. ETL项目 ETL项目提案 团队成员: 拉斐尔·塞拉诺(Raphael Serrano) 斯沃巴比卡耶娜 托马斯·梅纳(Thomas Maina) 戴安娜·麦登科(Diana Madonko) 项目概况 我们感兴趣的问题是探索世界各地已出版的书籍和相关信息。 这些数据将能够帮助人们选择书籍,因为它将提供有关评级,可负担性以及其他影响他们选择的领域的更多信息。 摘录-拟议的数据来源 •数据位于何处? 卡格勒 Google图书•数据集格式是什么? CSV JSON•您将如何获取此数据
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:36700160
    • 提供者:weixin_42160645
  1. Udacity_DisasterResponse_Project:Udacity项目-ETL,NLP-预测消息类别-源码

  2. Udacity_DisasterResponse_Project Udacity项目-ETL,NLP-预测消息类别 1.安装运行Web应用程序和python文件所需的软件包:Python Pandas Numpy NLTK Flask Plotly SQLite3 SQLalchemy SKLEARN Pickle 2.项目动机图八“多语言灾难响应消息”的开放式数据集包含在灾难事件期间发送的真实实时消息。 这些消息和对灾难类别的分类用于创建机器学习模型。 基于该模型,可以使用Web flas
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:2097152
    • 提供者:weixin_42159267
  1. etl-monitor-frontend-源码

  2. CFE 项目设置 npm install 编译和热重装以进行开发 npm run serve 编译并最小化生产 npm run build 自定义配置 请参阅。
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:73728
    • 提供者:weixin_42120275
  1. project_2:Bootcampspot项目2-源码

  2. Netflix或Disney +和chill(ETL项目) Notebooks文件夹包含所有python代码 在运行任何代码之前,只需确保项目文件夹结构类似于: repo_root│├──笔记本│├──01_xxx-笔记本文件│├──02_xxx│├──03_xxx│└──xxx.py-python文件│ ├──资源│├──xxx.tsv-数据集文件│├──xxx.csv │└──xxx.sqlite│├──烧瓶│├──app.py│├──myfunc.py│├──kaggle.py │├──
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:35840
    • 提供者:weixin_42160376
  1. ETL项目:UNC CH BC ETL项目-源码

  2. ETL项目:UNC CH BC ETL项目
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:1024
    • 提供者:weixin_42150341
  1. Redshift_Data_Warehouse:这是来自数据工程Udacity课程的项目3-源码

  2. 项目描述 音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及其应用程序中的歌曲上具有JSON元数据的目录中。 Sparkify希望数据工程师构建执行以下操作的ETL管道: - Extracts their data from S3 - Stages them in Redshift - Transforms data into a set of dimensional ta
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:189440
    • 提供者:weixin_42104366
  1. 灾难响应管道:Udacity纳米度的第二个项目-Datascience-源码

  2. 灾害响应管道项目 Github仓库 指示: 在项目的根目录中运行以下命令来设置数据库和模型。 运行ETL管道以清理数据并将其存储在数据库中python data/process_data.py data/disaster_messages.csv data/disaster_categories.csv data/DisasterResponse.db 运行用于训练分类器并保存python models/train_classifier.py data/DisasterResponse.d
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:23068672
    • 提供者:weixin_42143806
  1. 数据工程项目:与数据工程相关的项目文件-源码

  2. 数据工程项目 与数据工程相关的项目文件所有要求都在以“ 0”开头的文件夹中。 使用的工具和技术是: Microsoft SQL Server(DDL,DML) Informatica(ETL职位) Power BI(报告和仪表板) 由于访问受限,该项目主要包含快照和sql脚本,但它清楚地说明了其中涉及的所有方法。 仪表板文件“ 11_”是一个Power Bi文件,可以通过查看该文件来了解项目。
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:18874368
    • 提供者:weixin_42140625
  1. ETL项目-源码

  2. ETL项目 团队明显不同:•阿迪亚•罗萨里奥•迈克尔•乔纳森 项目:将足球运动员的现实生活统计数据与相应FIFA电子游戏年中的个人评分进行比较 ËXTRACT:下面是来自哪里的项目数据被检索(CSV,JSON,pgAdmin的4等)的资源的链接。 • (CSV) • (CSV) 转换:数据清理主要包括选择相关列,删除空值并将空值更改为0。 •仅选择必要的列•降低NaN值•将NaN值更改为0 劳阿德( L oad):选择该数据是为了比较和分析2019年和2020年的真实玩家属性与FIF
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:6291456
    • 提供者:weixin_42127835
  1. ETL项目-源码

  2. ETL项目 在项目的所有阶段与团队紧密合作,以确保不会出现意外情况; 想象有大量数据输入,您和您的团队要负责将其迁移到生产数据库。 我们使用三个来源:来自Kaggle的一个CSV文件和两个互联网来源(Billboard前100名和Insider),我们将数据提取,转换并加载到不同的集合中,以供以后进一步分析。 提取:您的原始数据源(CSV和JSON)。 以csv格式读取的样本。 也可以从实时网页中阅读。 转换:数据清理和转换 广告牌循环 使用三个for循环提取标题,艺术家和年份,然后执行合并
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:146432
    • 提供者:weixin_42140846
  1. ETL项目:ETL项目-源码

  2. ETL项目 本杰明·奥布里(Benjamin Aubry),加里·费舍尔(Gary Fisher)和布鲁斯·马克(Bruce Mark)撰写。 该项目是关于建立一个包含财务数据(即商品的历史价格,美联储数据和经济事件数据)的数据库,该数据库可用于进一步的数据分析。 不同的数据源以及数据结构(API,Web)导致了MongoDB的创建,该数据库为此类数据存储提供了灵活性。 该数据库吸收3个不同的数据源(请参见下文): –商品历史价格(通过API) –美联储数据(通过API) –经济
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:5242880
    • 提供者:weixin_42131785
  1. ETL项目-源码

  2. ETL项目 项目的ETL流程最初是使用Kaggle的两个数据集进行的。 一个数据集包含有关印度食品配方的信息,另一个数据集包含有关常见食品和产品的营养价值的信息。 数据集的两个链接都可以在这里找到: ETL的EXTRACT部分首先使用简单的pd.read语句将这些数据集中的CSV加载到我们的Jupyter Notebook中。 读完CSV文件后,ETL的TRANSFORMATION(清洗)部分要求我们从包含成分类型的两个数据框中拆分或拆分列。 我们使用了split函数将每种成分分解为单独的
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:1048576
    • 提供者:weixin_42097914
  1. ETL项目-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:58720256
    • 提供者:weixin_42168902
  1. ETL项目-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:51200
    • 提供者:weixin_42114041
  1. ETL项目:SmartMilk-源码

  2. ETL项目 智能牛奶 对于我们的ETL小组项目,我们希望以不同的邮政编码查看不同商店的牛奶价格。 在Kroger和HEB网站上,我们将使用以下字段来构建关系数据库:邮政编码价格大小(基于HEB网站上的名称)名称(基于名称的类型)(基于名称的品牌) 我们将使用SQL构建结构化的数据库。 Kroger有自己的API,我们可以使用它为他们的产品建立数据库,但HEB没有,因此我们将使用抓取来建立其产品的数据库。 数据清理将包括字符串操作,以确定每种产品的类型和品牌(对于HEB而言,是数量)。
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:1048576
    • 提供者:weixin_42144366
  1. ETL项目-源码

  2. ETL项目
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:93323264
    • 提供者:weixin_42170064
« 12 3 4 5 6 7 8 9 10 »