您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Deep_Rec:存放推荐算法相关代码,文档,资料-源码

  2. 本库用于存放推荐的相关算法代码和文档 DeepRank / 概述 对输入特征,特征工程,核心模型,模型输出分别进行了封装。模型更新交替的时候可以针对性的修改指定模块,也方便后续模型的切换,,特征的迭代,以及输入数据在输入,特征工程,保存模型,在线服务各个模块的统一配置。 数据读取 利用tfrecords/下一个代码可以很方便的利用spark扩展将数仓经过ETL的hive表训练数据转换成frecords格式,并存储HDFS上。 配置设置 model_schema.json 配置训练数据中的细分,可
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:60416
    • 提供者:weixin_42099814
  1. hummingbirdSystem:蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL),并提供可视化分析,帮助企业构建整合合在一起业务的企业洞察,并利用数据方法覆盖各层员工及应用场景-源码

  2. 蜂鸟系统 蜂鸟数据分析平台使用Hadoop,Hive,Hbase,Kylin,Kettle,Superset等技术实现数据建模,自定义ETL操作,多维数据分析以及数据可视化的功能。 数据分析 数据分析的三重境界: 1.统计计数 2.多维分析 3.机器学习 数据分析的统计计数和多维分析,通常是数据探索式分析,旨在了解数据的特性,进而增加挖掘数据的价值。而基于对数据的理解,再重新机器学习的算法对数据做大多数公司实际上没有任何费用去建造复杂的数据分析平台,面对快速变化的业务需求,很多数据工程师都把自
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:7340032
    • 提供者:weixin_42166626
  1. DataVec:用于机器学习的ETL库-数据管道,数据处理和处理-源码

  2. 数据载体 DataVec是Apache 2.0许可的库,用于机器学习ETL(提取,转换,加载)操作。 DataVec的目的是将原始数据转换为可用的矢量格式,然后将其提供给机器学习算法。 通过向该存储库贡献代码,您同意根据Apache 2.0许可提供您的贡献。 为什么要使用DataVec? 数据处理有时会很混乱,我们认为它应该与高性能代数库(例如nd4j或Deeplearning4j)区分开。 DataVec使从业人员可以获取原始数据并快速生成符合开放标准的矢量化数据(svmLight等)。
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:25165824
    • 提供者:weixin_42139042
  1. algorithm_classification_k-nearest_neighbor:这是一个乳腺癌分类数据集项目,用于定义在简单的ETL之后使用K最近邻居算法在人中是否会发生癌症扩散。-源码

  2. algorithm_classification_k-nearest_neighbor:这是一个乳腺癌分类数据集项目,用于定义在简单的ETL之后使用K最近邻居算法在人中是否会发生癌症扩散。
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:78643200
    • 提供者:weixin_42164931
  1. 算法ETL-源码

  2. DS-算法分配 此仓库适用于DS-Algo课程中的所有作业。 我们已经为每个作业创建了文件夹。 您可能还会在每个作业文件夹下找到一个带有您的名字的子文件夹,请将您的代码,文档等提交到相应的子文件夹中,并在每个作业的到期日之前提交PR。 您可以随时提交/推送代码,但是只有那些在截止日期之前提交的代码才被视为最终标记。 完成评估后,所有拉动请求都将被批准,以便您可以彼此共享/学习。 快乐算法~~~
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:10485760
    • 提供者:weixin_42168265
  1. 灾害响应管道-源码

  2. 灾害响应管道项目 灾难响应管道是一种NLP机器学习算法,可提取和处理紧急响应服务收到的帮助消息。 这些消息然后按消息内容分类,并显示在方便使用的Web应用程序中。 使用说明 在项目的根目录中运行以下命令来设置数据库和模型。 运行ETL管道以清理数据并将其存储在数据库中python data/process_data.py data/disaster_messages.csv data/disaster_categories.csv data/DisasterResponse.db 运行用于训
  3. 所属分类:其它

    • 发布日期:2021-02-08
    • 文件大小:22020096
    • 提供者:weixin_42168830
  1. Udacity-Data_Scientist_Nanodegree:该存储库包含我在数据科学家Nanodegree期间执行的所有项目-源码

  2. 资料_科学家_纳米度 为Udacity数据科学家纳米学位项目1完成的项目 :建立了一种算法,可以最好地识别潜在的捐助者。 :使用PyTorch实现图像分类器。 :应用无监督学习技术来确定最有可能成为邮寄活动产品购买者的人群。 Udacity数据科学家纳米学位第二学期完成的项目 :分析2017年以来的堆栈溢出数据,以得出一些问题的结果,例如“开发人员在堆栈溢出方面的活跃度如何?” “开发人员的薪水与他们在Stack Overflow上的活动有关吗?” “用户帐户的状态是否与用户行为有关?可以进
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:36700160
    • 提供者:weixin_42109598
  1. Kaggler:Kaggle数据科学竞赛代码-源码

  2. 卡格勒 Kaggler是一个Python软件包,用于轻量级在线机器学习算法和ETL和数据分析的实用程序功能。 它根据MIT许可证分发。 其在线学习算法的灵感来自Kaggle用户。 它使用可有效处理大型稀疏数据的稀疏输入格式。 核心代码通过使用Cython进行了速度优化。 安装 依存关系 所需的Python软件包列在requirements.txt 赛顿 h5py 超光 lightgbm ml_metrics numpy / scipy 大熊猫 scikit学习 使用点子 PyPi提供
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:64512
    • 提供者:weixin_42125770
  1. etl:嵌入式模板库-源码

  2. 嵌入式模板库(ETL) 动机 C ++是用于嵌入式应用程序的出色语言,而模板是强大的方面。 标准库可以提供大量经过良好测试的功能,但是标准库的某些部分与确定性行为和有限的资源要求不太匹配。 这些限制通常会阻止使用具有开放式大小的动态分配的内存和容器。 需要一个模板库,用户可以在其中声明对象的大小或任何对象的最大大小。 大多数嵌入式编译器当前不支持C ++ 03以后的标准,因此使程序员无法使用更高版本库的增强功能。 这是ETL试图实现的目标。 概要 ETL并非旨在完全替代STL,而是对其进
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:2097152
    • 提供者:weixin_42176827
  1. Dsiaster_Responce:处理灾难消息以有效地对其进行分类以快速响应-源码

  2. 灾害响应管道项目 处理灾难消息以有效地对其进行分类以快速响应 介绍: 该项目旨在对灾难中人们发送的来自不同来源的消息进行分类,以便紧急部门使用机器学习算法对消息进行正确及时的响应,因此,使用机器学习技术构建的模型可以对灾难消息进行正确分类。 完成项目所需的步骤如下: ETL或提取加载并将数据传输到数据库文件。 机器学习管道,其加载已清理的数据并构建,训练和测试模型,然后将模型输出为pkl文件。 基于模型和数据运行的Flask Web应用程序,使用Plotly库可视化数据。 Python
  3. 所属分类:其它

    • 发布日期:2021-04-01
    • 文件大小:20971520
    • 提供者:weixin_42160645