您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. udacity-data-engineering-nanodegree:Github资源库,用于项目上传-源码

  2. 数据工程纳米课程 这GitHub的库是为完成所有完成所需要的项目取得Udacitiy课程。 储存库结构 在仓库中,每个目录代表一个项目(项目按提交时间排序)。 每个目录都有其自述文件,因此请随时检查它们 该项目提供了一个很好的示例,说明了如何使用和psycopg2作为数据库适配器在Postgresql中构建,填充和测试关系数据库(DB)。 在这个项目中,我们使用作为项目的数据源从SQL迁移到NoSQL。 它是使用, cassandra作为DB适配器和CQL作为python之外的编程语言开发的。
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:589824
    • 提供者:weixin_42134240
  1. udacity-data-modeling:创建该项目的目的是为Sparkify提供基于PostgreSQL尺寸模型-源码

  2. 使用Postgres进行数据建模 罗德里戈·科埃略(Rodrigo Coelho) 介绍 这是Udacity数据工程纳米学位的项目。 在此项目中,为Sparkify创建了一个数据库,该公司的目标是提高其分析能力 概括 应用所有ETL步骤以为Sparkify提供星型模式模型。 选择了启动模式,因为它是最易于分析的模型之一。 总而言之,数据是从JSON源提取的,使用Pandas DataFrame进行转换,然后加载到数据库中。 ETL过程中使用了两组数据。 歌曲和日志数据。 歌曲数据可提供歌曲和艺术
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:514048
    • 提供者:weixin_42117032
  1. Udacity-Data-Engineering-6:数据工程的顶峰项目-源码

  2. Udacity-数据工程-6 顶石项目 关于/简介 在数据工程的顶峰项目中,我结合了我在整个程序中学到的知识。 我从Udacity提供的包含四个数据集的项目开始。 主要数据集包括有关移民到美国的数据,补充数据集包括有关机场代码,美国城市人口统计数据和温度数据的数据。 所得数据集可用于分析前往美国的旅行和移民趋势。 目录 项目范围 我将研究四个数据集,分别是美国移民数据,美国城市人口统计信息,天气信息和机场数据。 所得数据集可用于分析前往美国的旅行和移民趋势。 我正在使用本地Spark实例来处理本
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:38797312
    • 提供者:weixin_42131316
  1. Data-Modeling-With-PostgreSQL:PostgreSQL进行数据建模和ETL管道以实现Udacity数据工程纳米级-源码

  2. 目标: 将以下概念付诸实践: 数据建模(应用概念建模,然后构造事实表和维度表) 数据库模式(将特定的模式应用于事实和维度表,适合我们的数据大小和结构=>星型模式) ETL管道(构造ETL管道以将数据从日志文件传输到数据库表) 项目描述: 该项目的目的是为一个名为Sparkify的虚构音乐流服务创建SQL分析数据库。 Sparkify的分析团队致力于了解用户在公司音乐应用上播放歌曲的内容,时间和方式。 分析师需要一种简单的方法来查询和分析数据,这些数据当前存储在应用程序上用户活动的
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:491520
    • 提供者:weixin_42128270
  1. Disaster-Response-Pipeline:灾难响应管道项目是Udacity Data Scientist Nanodegree的一部分-源码

  2. 灾害响应管道 灾难响应管道项目是Udacity Data Scientist Nanodegree的一部分。 项目概况 在这个项目中,数据工程被应用来分析图八中的灾难数据,以建立用于对灾难消息进行分类的API的模型。 档案文件 - ETL Pipeline Preparation.ipynb: contains ETL pipeline preparation code - ML Pipeline Preparation.ipynb: contains ML pipeline preparati
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:5242880
    • 提供者:weixin_42113552
  1. Udacity-Projects:Udacity的研究代码-源码

  2. 概述 该存储库包含我在Udacity的数据工程纳米学位计划期间开发的代码。 我只包括我在每课中从事的项目,而不包括测验问题等。 课 项目 1个 Postgres中的数据建模和实现 2个 Apache Cassandra数据建模 3 Amazon Redshift ETL管道 4 Apache Spark数据湖 5 Apache Airflow中的数据管道 6 <不在此文件夹中,请参阅Udac-Capstone存储库
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:317440
    • 提供者:weixin_42115074
  1. Plagiarism-Dectector-2021:最终的Udacity纳米学位项目-源码

  2. 抄袭项目,机器学习部署 该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。 项目概况 在这个项目中,您将负责构建a窃检测器,该检测器将检查文本文件并执行二进制分类。 根据该文本文件与提供的源文本的相似程度,将该文件标记为抄袭或不抄袭。 侦查窃是一个活跃的研究领域。 这项任务很艰巨,解释的答案和原始作品之间的区别通常并不那么明显。 该项目将分为三个主要笔记本: 笔记本1:数据探索 加载窃文本数据的语料库。 探索现有的数据功能和数据分布。 这第一台笔记本是不是在你
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:553984
    • 提供者:weixin_42181888
  1. Udacity_DataEngineering_Nanodegree:Udacity数据工程纳米学位证书的项目文件-源码

  2. Udacity_DataEngineering_Nanodegree Udacity数据工程纳米学位证书的项目文件
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:1024
    • 提供者:weixin_42099087
  1. Data_Engineering_Nanodegree:回购以存储有关Udacity上的数据工程纳米学位的文件和一些项目-源码

  2. Data_Engineering_Nanodegree:回购以存储有关Udacity上的数据工程纳米学位的文件和一些项目
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:21504
    • 提供者:weixin_42099858
  1. DEND-Capstone-Project:Udacity数据工程ND-源码

  2. DEND-Capstone-Project Udacity数据工程ND
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:1048576
    • 提供者:weixin_42105169
  1. 闪亮的-源码

  2. 闪亮的 该项目是为Udacity数据工程纳米学位计划而设计的。 项目01 要查看有关项目01的信息,
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:3145728
    • 提供者:weixin_42113794
  1. 音乐趋势-ETL管道:Udacity Capstone项目-源码

  2. 音乐趋势-ETL--管道 数据工程NanoDegree Capstone项目 项目总结 音乐随着时间变化了很多,每种音乐都有其独特的风格和节奏。 随着越来越多的音乐发行,人们需要使用可靠的方法快速访问有关最新趋势的信息。 该项目旨在组织可用信息,以更好地分析音乐发展趋势。 使用Spotify,Billboard等各种服务的API,收集Genius数据。 利用可用的数据源,构建了能够处理大量数据的端到端数据管道。数据湖将由按某些列划分的逻辑表组成,以优化查询延迟,并可用于查询以改善决策制作。
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:126877696
    • 提供者:weixin_42106357
  1. udacity-data-eng-p2-源码

  2. 项目:数据仓库(2) 数据工程纳米学位 学生:Brian Pederson 项目描述 使用虚拟启动公司Sparkify,使用由一个事实和四个维度组成的AWS Redshift构建一个维度星型架构数据模型。 编写一个基本的ETL管道,该管道使用Python和SQL从存储在AWS S3存储桶中的源json文件传输数据。 数据源(json文件) song_data-s3:// udacity-dend / song_data log_data-s3:// udacity-dend / log_da
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:32768
    • 提供者:weixin_42134143
  1. udacity-data-eng-p3-源码

  2. 项目:数据湖(3) 数据工程纳米学位 学生:Brian Pederson 项目描述 使用虚拟启动公司Sparkify,利用在AWS上运行的Spark构建一个由一个事实和四个维度组成的维度星型架构数据模型。 编写一个基本的ETL管道,该管道使用Python和SQL从存储在AWS S3存储桶中的源json文件传输数据,然后将事实和维度作为拼写文件输出到AWS S3存储桶中。 数据源(json文件) song_data-s3:// udacity-dend / song_data log_data
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:31744
    • 提供者:weixin_42120997
  1. dend-project-3:Udacity数据工程纳米学位项目3:具有S3和Redshift的AWS ETL管道-源码

  2. | | 2020-11-23 项目3:AWS数据仓库 音乐流媒体创业公司Sparkify已经扩大了用户群和歌曲数据库,并希望将其流程和数据转移到云中。 他们的数据位于S3中,位于应用程序上有关用户活动的JSON日志目录中,以及位于应用程序中的歌曲上的具有JSON元数据的目录中。 他们要求数据工程师建立一个ETL管道,该管道从S3提取数据,在Redshift中进行分级,然后将数据转换为一组维度表,供其分析团队使用,以继续寻找用户正在收听的歌曲的见解。 通过运行Sparkify分析团队提供给您的
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:62464
    • 提供者:weixin_42125826
  1. Udacity数据工程-源码

  2. 数据工程纳米学位 Udacity在DEND纳米学位中开发的项目和资源。 项目1:关系数据库-使用PostgreSQL进行数据建模。 使用PostgreSQL开发了一个关系数据库,以对音乐流应用程序的用户活动数据进行建模。 技能包括:使用PostgreSQL创建关系数据库使用事实和维度表的优化定义开发星型数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 经验包括:Python,PostgreSql,Star Schema,ETL管道,规范化 项目2:NoSQL数据库
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:4194304
    • 提供者:weixin_42129005
  1. postgres-data-modeling-project:Udacity数据工程纳米学位的第一个项目-源码

  2. Udacity数据工程纳米学位课程 项目:使用Postgres进行数据建模 介绍 一家名为Sparkify的初创公司是一个音乐流应用程序。 他们需要分析他们收集的数据。 数据-json格式的文件,用于记录用户活动和歌曲的元数据。 为了实现此目标,我们创建了一个Postgres数据库和一个ETL管道,该管道使用Python和SQL将文件中的数据传输到该数据库中。 数据库 为了满足Sparkify的分析重点,我们使用星型模式构建数据库。 事实表 'songplays'-来自与歌曲播放相关的日志数据
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:476160
    • 提供者:weixin_42097668
  1. udacity-dend-project-3:Udacity数据工程师纳米学位-Project-3(数据仓库)-源码

  2. (Udacity:数据工程纳米学位)| | 2019-05-04该项目是。 项目3:数据仓库 快速开始 首先,将dwh_template.cfg重命名为dwh.cfg并填写打开的字段。 填写AWS acces密钥(KEY)和密钥(SECRET)。 要访问AWS,您需要在AWS中执行以下操作: 创建IAM用户(例如dwhuser) 使用AmazonS3ReadOnlyAccess访问权限创建IAM角色(例如dwhRole) 获取ARN 创建并运行Redshift集群(例如dwhClus
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:693248
    • 提供者:weixin_42174098
  1. Udacity-Data-Engineering:Udacity数据工程纳米学位(DEND)-源码

  2. 数据工程纳米学位 Udacity在开发的项目和资源。 项目1: 。 使用PostgreSQL开发了一个关系数据库,以对音乐流应用程序的用户活动数据进行建模。 技能包括: 使用PostgreSQL创建一个关系数据库 使用事实和维度表的优化定义开发了一个Star Schema数据库。 表的规范化。 建立了ETL管道来优化查询,以便了解用户听的歌曲。 能力包括:Python,PostgreSql,Star Schema,ETL管道,规范化 项目2: 。 根据项目一中概述的原始架构,使用Apa
  3. 所属分类:其它

    • 发布日期:2021-02-01
    • 文件大小:1048576
    • 提供者:weixin_42097369
  1. Udacity-Data-Engineering-Projects:与数据工程相关的项目很少,包括数据建模,云上的基础设施设置,数据仓库和数据湖开发-源码

  2. 数据工程项目 项目1:使用Postgres进行数据建模 在这个项目中,我们将数据建模与Postgres结合使用,并使用Python构建ETL管道。 一家初创企业希望分析他们在新音乐流应用程序上收集的有关歌曲和用户活动的数据。 当前,他们正在以json格式收集数据,分析团队对了解用户正在收听的歌曲特别感兴趣。 链接: 项目2:使用Cassandra进行数据建模 在这个项目中,我们将Data Modeling与Cassandra结合使用,并使用Python构建ETL管道。 我们将围绕要获取答案的
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:2097152
    • 提供者:weixin_42107561
« 12 3 »