您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 大数据_数据库创新的驱动力

  2. 显而易见,大数据领域的大规模数据管理和复杂数据分析已经成为新的研究前沿。目前的各类大数据应用正是大数据研究的驱动力,比如社会网络、移动计算、科学应用等等。这些应用产生的大数据往往具有海量、时序动态性、多样等特性,给数据库领域的各项技术带来巨大挑战,涵盖包括数据获取、组织管理、分析处理和应用呈现等整个数据管理生命周期。
  3. 所属分类:其它

    • 发布日期:2014-05-23
    • 文件大小:14336
    • 提供者:u013773927
  1. UniEAP®包含开发工具、技术框架、通用技术组件和软件开发方法学,提供从需求、设计、开发、调试、部署到运维的应用全生命周期一站式服务,支撑IT应用的敏捷构建。

  2. UniEAP®包含开发工具、技术框架、通用技术组件和软件开发方法学,提供从需求、设计、开发、调试、部署到运维的应用全生命周期一站式服务,支撑IT应用的敏捷构建。 家族产品组成 UniEAP®家族产品围绕企业IT应用构建的两个核心业务“数据和流程”,关注应用构建的两个关键指标“效率和质量”,打造一个敏捷、高效的业务基础平台,家族产品包括: 平台优势 优秀的平台=卓越的技术+丰富的资产+科学的方法 应用全生命周期支撑 采用先进的技术架构,通过组件化、模型化、模板化、可变化和可视化的开发平台 支撑应
  3. 所属分类:Java

    • 发布日期:2016-09-04
    • 文件大小:3145728
    • 提供者:u012531655
  1. 数据科学项目生命周期.pdf

  2. 该文档是介绍数据科学项目生命周期的书籍,请大家下载!
  3. 所属分类:算法与数据结构

    • 发布日期:2019-09-01
    • 文件大小:86016
    • 提供者:qq_38350621
  1. Vertica实时数据分析平台

  2. 深度介绍Vertica产品总体架构、核心优势、集群能力、Vertica与Hadoop的数据交换、SQL高级分析、与分布式R无缝集成、灾备能力等等,是不可多得的了解Vertica的好资料。数据分析平台演进阶段及挑战 事件触发,全量数据实时分析频 价值实 业务相关性分析 繁访问 产品分析、用户行为分析客客户活动预测,客户流失预测,直接提升业务 户分析等灵活直询和数据分析产品盈利预测 面向大量业务人员 MOLAP CUBE生成 面向少量管理者的机器学习和 现整合层行业模型批量加工 预测 监管报送等数据
  3. 所属分类:Hadoop

    • 发布日期:2019-04-20
    • 文件大小:4194304
    • 提供者:skyon
  1. HPC_DME_APIs:NCI高性能计算数据管理服务通用API-源码

  2. HPC_DME_API NCI高性能计算数据管理服务通用API 高性能计算(HPC)支持要克服的最重大挑战之一是有效的数据管理,即跟踪,注释和分级数字数据集,以及针对这些数据集的数据生命周期策略。 尽管通常不认为这是HPC的挑战或机遇,但仍需要一种有效的解决方案来控制存储数据的成本,同时提高在“大数据”时代创建的数据的科学实用性,因为在“大数据”时代,数据集的分析可能需要几天的时间和总成本存储和维护大型数据集将继续增加人员和财务资源的负担。 如果没有可靠的托管数据集解决方案,大型数据集通常会
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:557842432
    • 提供者:weixin_42116596
  1. 699finalproject-源码

  2. 699最终项目 您好,我叫Matthew Hui,我是旧金山大学目前在读数据科学的硕士研究生。 该存储库适用于我的机器学习实验室课程,我们在其中探讨了scikit-learn的各种功能以及如何在数据科学生命周期中使用它。 您可以在找到的链接 您可以在找到指向我的代码的链接,也可以从存储库中下载它。 数据 该数据集包含有关报名参加公司数据科学课程的各种候选人的信息。 该公司正试图找出这些候选人中的哪些人选修了学习新技能的课程,而哪些人正在寻找新的工作。 数据集包含约19,000行和14列。 特征
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:252928
    • 提供者:weixin_42131705
  1. systemds:用于端到端数据科学生命周期的开源ML系统-源码

  2. 注意: SystemDS已合并回Apache SystemML,成为 (2020年3月27日)。 系统DS 概述: SystemDS是用于端到端数据科学生命周期的通用系统,从数据集成,清理和功能工程到有效的本地和分布式ML模型培训,再到部署和服务,都可从其实现。 为此,我们旨在为(1)数据科学生命周期的不同任务以及(2)具有不同专业知识的用户提供具有R形语法的声明性语言堆栈。 这些高级脚本被编译为本地,内存CPU和GPU操作以及Apache Spark上的分布式操作的混合执行计划。 与提供均质
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:7340032
    • 提供者:weixin_42116681
  1. dfv1-源码

  2. 数据奖学金课程第4级(v1) 意图 在Multiverse,我们的目标是通过教他们每天将需要使用的工具和概念,使他们成为专业的数据分析师。 我们课程的核心是数据分析生命周期,这是一个北极星原则,可帮助学徒“思考数据”并在其角色和项目的各个方面提供指导。 学习不是一条直线之路,而是螺旋式的发展,在此过程中,我们不断地建立和扩展先前的学习,以帮助学徒获得关于他们如何进行分析的新见解和新观点。 在整个课程中,我们将通过各种工具和软件(例如Microsoft Excel,SQL,PowerBI,Pyt
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:47185920
    • 提供者:weixin_42123456
  1. brian_bacik:Brian的数据科学项目组合-源码

  2. 数据科学组合 这些年来,我完成了一系列项目,重点介绍了数据科学领域的技能,包括数据整理,假设测试,数据库管理,可视化,机器学习和深度学习。 由UTHealth公共卫生学院与贝勒医学院和哈里斯县公共卫生合作的研究项目。 通过此研究项目,我们为哈里斯县的每个人提供免费测试,并收集数据以更好地了解Covid-19在该地区的传播。 我的职责包括数据架构,收集,清理,分析和可视化。 建立分类模型,以预测银行信用卡客户的流失率。 通过网格搜索交叉验证优化了线性回归,随机森林和XGBoost。 引入了
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:1048576
    • 提供者:weixin_42149145
  1. AI4I_Data_Science_Project_Lifecycle:这是一份备忘录,旨在分享我在数据科学项目生命周期中学到的知识-源码

  2. AI4I_Data_Science_Project_Lifecycle 这是一份备忘录,用于分享我在数据科学项目生命周期中所学的内容,记录了学习目标以及我的个人笔记。 该课程由Infocomm媒体发展管理局(IMDA)针对工业的AI(AI4I)提供,并由LIM Tern Poh编写了24张幻灯片。 工业用AI(AI4I)是一个完全在线的程序,旨在帮助学习者增强PLUS技能,并学习Python中的数据科学,机器学习,人工智能和可视化。 该程序托管在AI Makerspace在线平台上。 Dat
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:1048576
    • 提供者:weixin_42151036
  1. my_portfolio_site:Brian的数据科学项目组合-源码

  2. my_portfolio_site Brian的数据科学项目组合 由UTHealth公共卫生学院与贝勒医学院和哈里斯县公共卫生合作的研究项目。 通过此研究项目,即使您没有生病,无论性别,种族,收入或移民身份如何,我们都为哈里斯县的所有人(包括儿童)提供免费测试。 我的职责包括数据架构,收集,清理,分析和可视化。 此处的公开信息中心: : 建立分类模型,以预测银行信用卡客户的流失率。 通过网格搜索交叉验证优化了线性回归,随机森林和XGBoost。 引入了具有随机欠采样,tomek链接
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:1048576
    • 提供者:weixin_42116585
  1. 使用机器学习的数据科学,薪水估计器:这个项目是我个人的经验,它与我的朋友自动化了机器学习算法,我们为了了解该项目的整个生命周期而建立了该算法。 该项目的主要目的是根据地理位置,工作年限等因素来确定数据科学员工的薪水。 这些项目的数据是从玻璃

  2. 数据科学薪酬估算器:项目概述 创建了一个估算数据科学人员薪水(MAE〜$ 11K)的工具,以帮助数据科学家在找到工作时就其收入进行协商。 使用python和selenium从glassdoor上刮取了1000多个工作描述,每个工作描述文本中的工程设计功能可量化公司对python,excel,aws和spark的重视程度。 使用GridsearchCV优化了线性,套索和随机森林回归,以达到最佳模型。 使用Flask构建面向客户的API 网页搜刮(* ) 调整了Web抓取器github repo
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:2097152
    • 提供者:weixin_42121086
  1. mnist_dvc-源码

  2. MNIST DVC 项目目标 使用MNIST数据集对图像中的数字进行分类 介绍 该存储库使用创建机器学习管道并跟踪Kaggle竞赛数字识别器的实验。 我们将使用的修改版本作为我们的数据科学生命周期模板。 该存储库模板基于。 为了开始,请克隆此存储库并安装 。 请遵循以下说明,使用DVC来管理参数,脚本,工件和度量标准,以贯穿数据科学生命周期。 1.领域理解/问题定义 数据科学生命周期的第一步是定义问题并理解问题领域和先验知识。 给定一个结构合理的问题,团队可以指定机器学习应用程序的目标(例如,
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:31744
    • 提供者:weixin_42170064
  1. systemds:Apache SystemML的镜像-源码

  2. Apache SystemDS 概述: SystemDS是用于端到端数据科学生命周期的通用系统,从数据集成,清理和功能工程,到高效,本地和分布式ML模型训练,再到部署和服务。 为此,我们的目标是为(1)数据科学生命周期的不同任务以及(2)具有不同专业知识的用户提供一种具有R类语法的声明性语言。 这些高级脚本被编译为本地,内存CPU和GPU操作以及Apache Spark上的分布式操作的混合执行计划。 与提供均质张量或2D数据集的现有系统相反,并且为了服务于整个数据科学生命周期,基础数据模型是D
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:31457280
    • 提供者:weixin_42127835
  1. VerticaPy:VerticaPy是一个Python库,它公开了类似于sci-kit的功能来对存储在Vertica中的数据进行数据科学项目,从而充分利用了Vertica的速度以及内置的分析和机器学习功能-源码

  2. :loudspeaker: 2020-06-27:VerticaPy是Vertica-ML-Python的新名称。 垂直 VerticaPy是一个具有scikit式功能的Python库,用于利用Vertica的速度以及内置的分析和机器学习功能对存储在Vertica中的数据进行数据科学项目。 它支持整个数据科学生命周期,使用“流水线”机制来顺序化数据转换操作,并提供精美的图形选项。 如今,“大数据”已成为数据科学界的主要主题之一,数据科学家通常是任何组织的中心。 越来越多的数据驱动带来的好处是不
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42134051
  1. employee-attrition-aif360:使用不同的工具,技术和算法演练数据科学生命周期。 使用AIF360,熊猫和Jupyter笔记本在Watson Machine Learning上构建和部署模型-源码

  2. employee-attrition-aif360:使用不同的工具,技术和算法演练数据科学生命周期。 使用AIF360,熊猫和Jupyter笔记本在Watson Machine Learning上构建和部署模型
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:2097152
    • 提供者:weixin_42181545
  1. rdmkit:ELIXIR数据管理工具包-在这里找到您的研究数据管理问题的答案-源码

  2. RDM工具包 Elixir研究数据管理套件 RDMkit是一个在线指南,其中包含从头到尾适用于研究项目的良好数据管理规范。 RDMkit由每天处理生命科学数据的人员开发和管理,它以各种不同的方式组织指南,信息和指针,以帮助您解决数据整个生命周期中的问题。 您将找到有用的建议,以了解您在数据生命周期中所处的位置(从收集计划到存档)以及可能遇到的哪种数据问题。 我们最新的工具和资源列表已与这些准则巧妙地交叉链接。 我们还针对生物学的不同领域及其专业数据类型量身定制了帮助,并提供了有关如何组装工具以
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:2097152
    • 提供者:weixin_42134143
  1. Complete-Life-Cycle-of-a-Data-Science-Project:完整的数据科学项目生命周期-源码

  2. 完整的数据科学项目生命周期 学分:所有相应资源 动机:创建此存储库的动机是为了帮助即将到来的有志之士并为数据科学领域的其他人提供帮助 业务了解 1.数据收集 数据由3种组成 a.Structure data (tabular data,etc...) b.Unstructured data (images,text,audio,etc...) c.semi structured data (XML,JSON,etc...) 多变的 a.qualitative (nominal,ordinal,b
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:168820736
    • 提供者:weixin_42104947
  1. forml:数据科学项目的生命周期管理框架-源码

  2. 格式 ForML是研究,实施和运营数据科学项目的框架。 使用ForML正式将数据科学问题描述为高级运算符的组成部分。 ForML将您的项目扩展为特定于给定生命周期阶段的任务依赖关系图,并使用其任何受支持的运行器执行它。 基于ForML构建的解决方案自然易于重用,扩展,重现或共享和协作。 不只是另一个DAG 尽管DAG (有向无环图)是ForML操作的核心,但由于以下原因,它在众多其他任务依赖项处理系统中脱颖而出: 它专门研究机器学习问题,即直接连接到流拓扑中。 高级运算符组合的概念,有助于将复
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:695296
    • 提供者:weixin_42127775
  1. dslp:数据科学生命周期过程是一个过程,该过程使数据科学团队从观念到价值反复不断地获得可持续发展。此存储库中记录了该过程-源码

  2. 数据科学生命周期过程 数据科学生命周期过程是一组说明性步骤和最佳实践,可帮助数据科学团队始终如一地交付价值。它包括用于常见数据科学工作类型的问题模板,适合数据科学开发流程的分支策略,以及有关如何将使数据科学工作所需的所有各种工具和工作流组合在一起的说明性指南。 入门 首先,您可以在阅读有关步骤。对以下这个过程中项目的模板库,可以发现。 有关这是什么以及为什么要考虑采用它的更多背景,请继续阅读下面的内容。 关键主题 我们为什么要创建它,为什么要采用它呢? 数据科学很难。企业数据科学难度更大。弄清楚
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:239616
    • 提供者:weixin_42181693
« 12 3 »