您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据不均衡问题经典文献《Learning from Imbalanced Data》

  2. 数据不平衡是指在数据集中,一类(或多类)样本特别多而另一类(或多类)样本特别少。这种问题广泛存在于金融欺诈、医学检测、网络入侵等场景中。
  3. 所属分类:机器学习

    • 发布日期:2017-12-15
    • 文件大小:1048576
    • 提供者:weixin_37447415
  1. 样本不均衡论文

  2. 1. 不平衡数据集分类的Random_SMOTE方法研究_董燕杰 2. 不均衡电信客户数据的分类问题研究_郭娜娜 3. 移动通讯话务量时间序列预测方法研究_雷苗
  3. 所属分类:机器学习

    • 发布日期:2018-05-05
    • 文件大小:9437184
    • 提供者:chasing_shadows
  1. 面向不平衡数据集的煤矿监测系统异常数据识别方法

  2. 异常数据识别对于煤矿安全监测系统具有重要作用,但安全监测系统中异常数据一般只占数据总量的1%左右,不平衡性是此类数据的固有特点。目前多数机器学习算法在不平衡数据集上的分类预测准确率和灵敏度都相对较差。为了能准确识别异常数据,以煤矿分布式光纤竖井变形监测系统采集的数据为研究对象,提出了一种面向不平衡数据集、基于去重复下采样(RDU)、合成少数类过采样技术(SMOTE)和随机森林(RF)分类算法的煤矿监测系统异常数据识别方法。该方法利用RDU算法对多数类数据进行下采样,去除重复样本;利用SMOTE算
  3. 所属分类:其它

    • 发布日期:2020-05-01
    • 文件大小:1048576
    • 提供者:weixin_38636577
  1. 基于半监督过采样非平衡学习的矿山微震信号识别

  2. 为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类器进行模式识别。通过在兖矿集团微震数据集进行试验,结果表明:针对微震数据的半监督过采样框架可以有效提高微震数据的识别准确率。与只进行过采样的方法相比,使用CPLE和SELF两种半监督学习的方法,在KNN、LR、FLD、RF、SVM和Adaboost这6个分类器上有5个分类器
  3. 所属分类:其它

    • 发布日期:2020-04-18
    • 文件大小:1048576
    • 提供者:weixin_38743235
  1. 不平衡数据学习综述【附4篇经典论文】.zip

  2. 以下附上不平衡数据学习的4篇综述论文,非常有阅读价值。针对不平衡数据集解决方法主要分为两个方面:第一种方案主要从数据的角度出发,主要方法为抽样,既然我们的样本是不平衡的,那么可以通过某种策略进行抽样,从而让我们的数据相对均衡一些;第二种方案从算法的角度出发,考虑不同误分类情况代价的差异性对算法进行优化,使得我们的算法在不平衡数据下也能有较好的效果。
  3. 所属分类:机器学习

    • 发布日期:2020-02-07
    • 文件大小:3145728
    • 提供者:syp_net
  1. 安川变频器Varispeed G7B系列产品样本(中文版).pdf

  2. 安川变频器Varispeed G7B系列产品样本(中文版)pdf,安川varispeed G7变频器,已经成功地大幅降低了对电机及电源造成的不良影响。解决了变频器潜在问题,同时提高了机械设备的等级。使用高性能、多功能varispeed G7,充分满足用户的高技术要求。具备了用户专用性功能及丰富的软件内存,能够快速对应用户特殊的要求。为用户所想从参数设定到维护保养,追求使用方便。世界上首次把3电平控制方式运用到400V级通用变频器,使变频器输出电压更接近正弦波。彻底解决了冲击电压造成的电机绝缘损伤
  3. 所属分类:其它

    • 发布日期:2019-10-19
    • 文件大小:37748736
    • 提供者:weixin_38744435
  1. 天津贝尔 ZAZP/ZAZN/ZAZM系列电动调节阀选型样本.pdf

  2. 天津贝尔 ZAZP/ZAZN/ZAZM系列电动调节阀选型样本pdf,天津贝尔 ZAZP/ZAZN/ZAZM系列电动调节阀选型样本目录 I电动单座、双座、套筒调节阀 BELLAZP ZAZP电动单座调节阀 (2) 2 BELLAZN电动双座调节阀 4) I3 ZAZA"电动套筒调节阀… BELL天津贝尔自动化仪表技术有限公司 电动调节阀系列 Ⅰ电动单座、双座、套筒调节阀 电动单座、双座、套筒调节阀由DKZ直行程或BEL系列直行程电动执行机构与阀芯为单座 型的阀体或阀芯为双座型的或阀芯为套筒型的阀
  3. 所属分类:其它

    • 发布日期:2019-10-13
    • 文件大小:505856
    • 提供者:weixin_38743602
  1. 基于支持向量机的多绳提升机钢丝绳张力不平衡预测

  2. 为了有效解决多绳提升机钢丝绳最大张力不平衡量的预测问题,提出了支持向量机预测模型,即先构造钢丝绳最大张力不平衡量样本序列,再运用支持向量机非线性回归算法预测钢丝绳张力最大不平衡量。试验分析结果表明,支持向量机预测模型不仅能有效进行钢丝绳张力最大不平衡量的预测,而且其预测精度优于新陈代谢GM(1,1)模型。
  3. 所属分类:其它

    • 发布日期:2020-07-01
    • 文件大小:212992
    • 提供者:weixin_38519763
  1. 基于核方法的虚拟样本构造

  2. 样本不平衡问题已经成为机器学习领域的研究热门。虚拟样本生成方法是一种重要的解决样本不平衡问题的方法,它通过线性生成少数类样本来实现。在以往的大多数研究工作中,虚拟样本的生成是在原始的特征空间中进行的,样本通常处于线性不可分的状态,将会导致生成的虚拟样本丢失几何特性。因此,文章提出了一种基于核方法的虚拟样本构造方法,虚拟样本在线性可分的核空间中生成。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:415744
    • 提供者:weixin_38678057
  1. 样本不平衡的睡眠数据分期研究

  2. 睡眠数据中各个阶段的样本数差异较大,睡眠数据的自动分期是一个典型的样本不平衡的机器学习问题。均衡样本方法通过抽样的手段来平衡样本,是解决样本不平衡问题的主要方法。采用均衡样本方法来平衡睡眠数据的不同阶段的样本,并且结合多域特征(时域、频域、时频域以及非线性)和随机森林分类算法进行分类预测。比较分析了样本均衡处理和非均衡处理的分类结果,发现均衡处理后的数据取得了更好的分类效果。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:169984
    • 提供者:weixin_38621624
  1. 关于pytorch处理类别不平衡的问题

  2. 当训练样本不均匀时,我们可以采用过采样、欠采样、数据增强等手段来避免过拟合。今天遇到一个3d点云数据集合,样本分布极不均匀,正例与负例相差4-5个数量级。数据增强效果就不会太好了,另外过采样也不太合适,因为是空间数据,新增的点有可能会对真实分布产生未知影响。所以采用欠采样来缓解类别不平衡的问题。 下面的代码展示了如何使用WeightedRandomSampler来完成抽样。 numDataPoints = 1000 data_dim = 5 bs = 100 # Create dummy d
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:45056
    • 提供者:weixin_38560039
  1. K-Means欠采样处理不平衡样本python实现

  2. K-Means欠采样python实现 1. K-Means欠采样原理 为解决分类问题中效果受样本集类间不平衡,并提高训练样本的多样性,可以使用K-Means欠采样对样本进行平衡处理。该方法利用K-means方法对大类样本聚类,形成与小类样本个数相同的簇类数,从每个簇中随机抽取单个样本与风险样本形成平衡样本集。K-means欠采样过程如下: Step1:随机初始化k个聚类中心,分别为uj(1,2,…,k); Step2:对于大样本xi(1,2,…,n),计算样本到每个聚类中心uj的距离,将xi划分
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:40960
    • 提供者:weixin_38641896
  1. K-Means欠采样处理不平衡样本python实现

  2. K-Means欠采样python实现 1. K-Means欠采样原理 为解决分类问题中效果受样本集类间不平衡,并提高训练样本的多样性,可以使用K-Means欠采样对样本进行平衡处理。该方法利用K-means方法对大类样本聚类,形成与小类样本个数相同的簇类数,从每个簇中随机抽取单个样本与风险样本形成平衡样本集。K-means欠采样过程如下: Step1:随机初始化k个聚类中心,分别为uj(1,2,…,k); Step2:对于大样本xi(1,2,…,n),计算样本到每个聚类中心uj的距离,将xi划分
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:40960
    • 提供者:weixin_38702945
  1. 数据挖掘:数据清洗——数据不平衡处理

  2. 数据挖掘:数据清洗——数据不平衡处理 一、什么是数据不平衡? 不平衡数据集指的是数据集各个类别的样本数目相差巨大,也叫数据倾斜。以二分类问题为例,即正类的样本数量远大于负类的样本数量。严格地讲,任何数据集上都有数据不平衡现象,一点的差异不会引起太多的影响,我们只关注那些分布差别比较悬殊的。 关于分布悬殊:如果类别不平衡比例超过4:1,那么其分类器会大大地因为数据不平衡性而无法满足分类要求的。因此在构建分类模型之前,需要对分类不均衡性问题进行处理。 不平衡数据的学习即需要在分布不均匀的数据集中学
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:590848
    • 提供者:weixin_38660731
  1. 不平衡数据的集成分类算法综述

  2. 集成学习是通过集成多个基分类器共同决策的机器学习技术,通过不同的样本集训练有差异的基分类器,得到的集成分类器可以有效地提高学习效果。在基分类器的训练过程中,可以通过代价敏感技术和数据采样实现不平衡数据的处理。由于集成学习在不平衡数据分类的优势,针对不平衡数据的集成分类算法得到广泛研究。详细分析了不平衡数据集成分类算法的研究现状,比较了现有算法的差异和各自存在的优点及问题,提出和分析了有待进一步研究的问题。
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:399360
    • 提供者:weixin_38675506
  1. 提高加权ELM以实现不平衡学习

  2. 用于单层前馈神经网络(SLFN)的极限学习机(ELM)是一种强大的机器学习技术,并且以其快速的学习速度和良好的泛化性能而受到关注。 最近,提出了加权ELM来处理具有不平衡类分布的数据。 加权ELM的关键本质是为每个训练样本分配了额外的权重。 尽管提供了一些经验加权方案,但是如何确定更好的样本权重仍然是一个悬而未决的问题。 在本文中,我们提出了一种Boosting加权ELM,它将加权ELM无缝地嵌入到经过修改的AdaBoost框架中,以解决上述问题。 直观地,反映训练样本重要性的AdaBoost框
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:572416
    • 提供者:weixin_38506182
  1. 基于BRC的不平衡文本情感分类的样本切割方法

  2. 基于BRC的不平衡文本情感分类的样本切割方法
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:1048576
    • 提供者:weixin_38616505
  1. 面向不平衡问题的集成特征选择

  2. 传统的特征选择方法基本上是以精度为优化目标,没有充分考虑数据样本类别分布倾斜性,在数据分布不平衡的数据集上性能表现不理想。在不平衡数据集上通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,然后将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成。在UCI不平衡数据集上的实验结果显示,提出的方法表现出了较好的性能
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:270336
    • 提供者:weixin_38577200
  1. 基于一趟聚类的不平衡数据下抽样算法

  2. 抽样是处理不平衡数据集的一种常用方法,其主要思想是改变类别的分布,缩小稀有类与多数类的分布比例差距.提出一种基于一趟聚类的下抽样方法,根据聚类后簇的特征与数据倾斜程度确定抽样比例,按照每个簇的抽样比例对该簇进行抽样,密度大的簇少抽,密度小的簇多抽或全抽.在压缩数据集的同时,保证了少数类的数量.实验结果表明,本文提出的抽样方法使不平衡数据样本具有较高的代表性,聚类与分类性能得到了提高.
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:244736
    • 提供者:weixin_38727087
  1. DenseLD:这是一种遗传精细映射方法,在目标基因组区域的SNPS中结合了连锁不平衡(LD)矩阵的致密LD块结构-源码

  2. 具有致密连锁不平衡区(DenseLD)的遗传精细映射 这是一种遗传精细映射方法,在目标基因组区域的SNPS中结合了连锁不平衡(LD)矩阵的致密LD块结构。 先决条件 分析需要MATLAB。 “ denseLD.m”是用于密集块检测的MATLAB函数,该函数最初来自先前程序包的“ NICE.m”。 “ denseLD.m”比“ NICE.m”具有更快的功能。 密集LD块检测可以在MATLAB中执行,也可以由R使用R包中的函数“ dense_block”来调用。 DenseLD还需要R包genla
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:1021952
    • 提供者:weixin_42138376
« 12 3 4 5 6 7 »