您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Regression回归算法代码

  2. 本文件包含多个数据集的代码示例,有广告、莺尾花、波士顿房价数据的回归代码,附带数据集,画出鸢尾花数据不同分类器的ROC和AUC曲线图
  3. 所属分类:Python

    • 发布日期:2019-06-14
    • 文件大小:38912
    • 提供者:qq_28930197
  1. 实例详解机器学习如何解决问题

  2. 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还 是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有 侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问 题。我们结合美团在机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器 学习InAction系列”标签的文章),介绍机器学习在解决工业界问题的实战中所需的基本技 术、经验和技巧。本文主要结合实际问题,概要地介绍机器学习解决实际问题的整个流
  3. 所属分类:机器学习

    • 发布日期:2019-07-02
    • 文件大小:1048576
    • 提供者:abacaba
  1. noshows:根据约会数据预测不出现-源码

  2. 在未预约的数据集( )(患者约会的数据集)上,我们试图预测患者是否愿意参加约会。只有大约1/4的患者没有出现,并且在此回购中,我们显示出通过生成更多的没有出现,我们可以改善患者没有出现分类器的性能。查看以下结果: 原始数据集结果: 模型 准确性 AUC 记起 精确 F1 河童 我的客户中心 TT(秒) 助推器 CatBoost分类器 0.8026 0.7461 0.0778 0.5843 0.1372 0.0942 0.1582 14.866 lightgbm 轻梯度升压机 0
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:15728640
    • 提供者:weixin_42134117
  1. Different-Metric-For-Supervised-Learning-源码

  2. 不同指标的监督学习 ##在此笔记本中,我尝试涵盖与分类回归和时间序列数据分类有关的所有度量标准,准确度,精度,F1得分混淆矩阵,二进制的ROC和AUC对数损失以及多标签分类回归度量标准,RMSE R2,误差,均值,绝对值错误
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:336896
    • 提供者:weixin_42133899
  1. DS_projects-源码

  2. DS_projects 项目 主要指标 描述 堆 二进制分类: 准确性 重新创建电信公司的资费推荐系统。 熊猫,numpy,sklearn, matplotlib 二进制分类: F1,AUC-ROC 预测客户是否离开银行。 熊猫,numpy,sklearn, matplotlib 回归: 利润,RSME 预测多个区域的油浓度。 引导并计算生产开放的利润和风险。 熊猫,numpy,sklearn, matplotlib,seaborn 回归: 斯玛普 在黄金生产的多个阶段分析和
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:4194304
    • 提供者:weixin_42171208
  1. 通过多模式深度学习增强对疾病与基因关联的预测

  2. 动机:以计算方式预测疾病基因有助于科学家优化深入的实验验证,并加快对与疾病相关的真实基因的鉴定。 现代高通量技术已经生成了大量的组学数据,并将其集成在一起,有望提高计算预测的准确性。 作为一种集成模型,多模态深层信任网(DBN)可以捕获来自异构数据集的跨模态特征,以对复杂系统进行建模。 研究表明其在图像分类和肿瘤亚型预测中的作用。 但是,多峰DBN尚未用于预测疾病与基因的关联。结果:在这项研究中,我们提出了一种通过多峰DBN(dgMDL)预测疾病与基因的关联的方法。 具体来说,蛋白质-蛋白质相互
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:421888
    • 提供者:weixin_38554193
  1. 基于AUC的SVM多类分类方法的研究

  2. AUC(ROC曲线下面积)评价标准已经广泛地用于度量机器学习中各种分类算法在两类数据集上的分类性能。首先介绍了SVM(支持向量机)多类分类方法,然后对AUC方法进行了系统地介绍,最后通过实验来比较各种SVM多类分类方法在多类别数据集上的AUC的值。实验结果表明,AUC值和核函数和多类转换方法的选取都有着密切的联系。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:231424
    • 提供者:weixin_38668335
  1. 基于多目标优化的SVM多类分类方法

  2. 为了利用ROC曲线下的面积(AUC),更好地评价多类SVM学习效果,提出了MOSMAUC(multi-objective optimizes multiclass SVM based on AUC)算法。该算法采用AUC作为评价标准,利用多目标优化算法作为SVM参数的优化方法,避免优化对象的AUC值过低问题,因为在多类分类学习中任何一个两类分类的AUC值太低,都会影响整体学习的效果。实验结果表明,提出的优化方法改进了算法的学习能力,取得了较好的学习效果。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:191488
    • 提供者:weixin_38577200
  1. Company-Classification-using-RoBERTa:基于使用Transformer架构的公司的文本信息的多类别分类(62个类别)-源码

  2. 问题陈述 给定Company Name和Business Descr iption ,任务是将公司分类。 共有62个类别 方法 删除重复的条目 跨类别的Wordcloud可视化 具有BOW和多项朴素贝叶斯的基线模型分别获得F-1和AUC分数分别为0.59和0.685 。 训练20时期后, RoBERTA的F-1和AUC分数分别为0.743和0.847的情况得到改善。
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:37748736
    • 提供者:weixin_42097967
  1. multiROC:在多类分类中计算和可视化ROC和PR曲线-源码

  2. 多ROC 跨多类分类计算和可视化ROC和PR曲线 接收器工作特性(ROC)和精度召回率(PR)是在各个领域比较二进制分类器的一种广泛使用的方法。 然而,许多现实世界中的问题被设计为多个类别(例如,癌症的肿瘤,淋巴结和转移分期系统),这需要一种评估策略来评估多类别分类器。 该软件包旨在通过使用置信区间计算多类ROC-AUC和PR-AUC并生成多类ROC曲线和PR曲线的发布质量图来填补空白。 可通过访问用户友好的网站。 1引文 一旦发表,请引用我们的论文:(已提交)。 2安装 从GitHub安
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:259072
    • 提供者:weixin_42168830
  1. 解毒:经过训练的模型和代码可以预测所有3个拼图有毒评论挑战中的有毒评论。 使用Pytorch Lightning和:hugging_face:变形金刚建造-源码

  2. :speak-no-evil_monkey: 排毒 有毒评论分类 :high_voltage: Pytorch闪电和 :hugging_face: 变形金刚 新闻与更新 轻量型 添加了经过Albert培训的较小模型,用于original模型和unbiased模型! 可以使用original-small和unbiased-small输入作为解毒方法,以相同的方式使用它们。 original-small样本的AUC平均得分为0.98281(之前为0.98856), unbiased-small样本的
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:209920
    • 提供者:weixin_42144707
  1. 面向不平衡数据的多层神经网络模型

  2. 传统的不平衡数据分类问题往往会因为类间数据不平衡造成分类器的性能下降。利用 AUC(ROC 曲线下的面积)为评价指标,结合单类 F-score 特征选择和遗传算法建立多层神经网络模型,选出对于不平衡数据分类更有利的特征子集,从而建立更适用于不平衡数据分类的深度模型。基于Tensor Flow建立多层神经网络模型,通过对4组不同UCI数据集进行测试,并与传统的机器学习算法如朴素贝叶斯、K最近邻、神经网络等进行对比验证。实验证明,所提模型在处理不平衡数据分类问题上的表现更优秀。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38499706
  1. 利用scikitlearn画ROC曲线实例

  2. 一个完整的数据挖掘模型,最后都要进行模型评估,对于二分类来说,AUC,ROC这两个指标用到最多,所以 利用sklearn里面相应的函数进行模块搭建。 具体实现的代码可以参照下面博友的代码,评估svm的分类指标。注意里面的一些细节需要注意,一个是调用roc_curve 方法时,指明目标标签,否则会报错。 具体是这个参数的设置pos_label ,以前在unionbigdata实习时学到的。 重点是以下的代码需要根据实际改写: mean_tpr = 0.0 mean_fpr = np.l
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:66560
    • 提供者:weixin_38550605
  1. 基于Stacking模型融合的专变用户电费回收风险识别方法

  2. 针对当前电力公司面临的专变用户电费回收风险,提出一种基于Stacking模型融合的专变用户电费回收风险识别方法。对专变用户数据进行特征处理、特征构造与特征筛选,从样本分布和特征属性上优化模型的泛化性能;利用Stacking模型融合多个基学习器,构建专变用户电费回收风险识别模型。实验结果表明,相较于其他常用的分类算法,所提方法具有更优的精确率、召回率、P-R调和均值、AUC值以及模型泛化性能,对专变风险用户的识别率也更高。
  3. 所属分类:其它

    • 发布日期:2021-01-15
    • 文件大小:1048576
    • 提供者:weixin_38676216
  1. 基于集成分类器的恶意网络流量检测

  2. 针对目前网络大数据环境攻击检测中因某些攻击步骤样本的缺失而导致攻击模型训练不够准确的问题,以及现有集成分类器在构建多级分类器时存在的不足,提出基于多层集成分类器的恶意网络流量检测方法。该方法首先采用无监督学习框架对数据进行预处理并将其聚成不同的簇,并对每一个簇进行噪音处理,然后构建一个多层集成分类器 MLDE 检测网络恶意流量。MLDE 集成框架在底层使用基分类器,非底层使用不同的集成元分类器。该框架构建简单,能并发处理大数据集,并能根据数据集的大小来调整集成分类器的规模。实验结果显示,当MLD
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:996352
    • 提供者:weixin_38657835
  1. 一种简化训练数据的跨项目缺陷预测的改进方法

  2. 对于历史数据有限的项目,跨项目缺陷预测(CPDP)引起了广泛关注。 据我们所知,由于低质量的跨项目培训数据,现有方法的性能通常很差。 这项研究的目的是通过简化训练数据(标记为TDSelector),为CPDP提出一种改进的方法,该方法考虑了每个训练实例具有的相似性和缺陷数量(以缺陷表示),并证明了这种方法的有效性。建议的方法。 我们的工作包括三个主要步骤。 首先,我们根据实例的相似性和缺陷的线性加权函数构造TDSelector。 其次,我们使用Logistic回归分类算法建立了我们实验中使用的基
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:1048576
    • 提供者:weixin_38675465
  1. Ensemble-Models-Practice:练习合奏模型-源码

  2. 套袋和随机森林作业 计算混淆矩阵,ROC曲线,AUC并理解比值和灵敏度概念 了解通用分类器并创建随机森林和装袋模型以胜过通用分类器 使用tree()函数创建树,并使用prune()函数创建修剪来引导多棵树进行聚合
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:4096
    • 提供者:weixin_42120275