您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于混合采样的非平衡数据集分类研究_古平_欧阳源遊

  2. 基于混合采样的非平衡数据集分类研究_古平_欧阳源遊
  3. 所属分类:讲义

    • 发布日期:2014-11-14
    • 文件大小:467968
    • 提供者:zidane0627
  1. 非平衡数据特征问题的研究与非平衡分类问题算法综述.

  2. 数据集合的非平衡性指不同类型的样本量的大小较为悬殊。近年来,肖衡 数据分类问题的重要性已经引起了广泛关注。然而,对于高维非平衡数据分类特 征选择技术的研究并不多见。本文在回顾了非平衡数据已有方法的同时,介绍了 两种新的应对方法,分别是基于类型分解的特征选择方法,以及基于Hellinger 距离的特征选择方法。
  3. 所属分类:专业指导

    • 发布日期:2015-02-09
    • 文件大小:10485760
    • 提供者:nneerr123
  1. 基于半监督过采样非平衡学习的矿山微震信号识别

  2. 为准确实现冲击矿压灾害的预防预警,提出一种半监督过采样框架对煤矿微震数据进行模式识别,采用主成分分析、小波变换和Fisher判别对微震数据集样本的多个信号通道进行特征提取;并对提取到的特征数据进行半监督非平衡学习;最后训练分类器进行模式识别。通过在兖矿集团微震数据集进行试验,结果表明:针对微震数据的半监督过采样框架可以有效提高微震数据的识别准确率。与只进行过采样的方法相比,使用CPLE和SELF两种半监督学习的方法,在KNN、LR、FLD、RF、SVM和Adaboost这6个分类器上有5个分类器
  3. 所属分类:其它

    • 发布日期:2020-04-18
    • 文件大小:1048576
    • 提供者:weixin_38743235
  1. 基于MapReduce的非平衡大数据集分类

  2. 非平衡大数据集分类是近年来机器学习领域的研究热点。因为许多实际应用领域中都存在非平衡大数据,如医疗诊断数据、信用卡欺诈检测数据、网络入侵检测数据等集。所以研究非平衡大数据集分类具有重要的理论意义和实际应用价值。针对两类非平衡大数据集分类,本文提出了正类样例交叉上采样与分类器集成相结合的方法。具体地,在上采样阶段,正类样例的上采样按下面两步交叉进行:第一步,利用Map Reduce计算正类样例的类中心,并在中心与每一个正类样例点的连线上进行采样;第二步,对新采样的正类样例中的每一个样例点,用Map
  3. 所属分类:算法与数据结构

    • 发布日期:2020-01-15
    • 文件大小:2097152
    • 提供者:sunearlier
  1. 基于流形嵌入过采样的非平衡数据分类方法

  2. 工业监测数据中正常与异常状态数据一般存在非平衡性,而传统的过采样非平衡数据处理方法往往在解决非线性、高维含噪的非平衡问题时不能获得满意的模式分类效果.本文利用流形学习的非线性降维,提出一种流形嵌入过采样方法,为有机结合流形学习与过采样的非平衡数据模式分类方法提供了统一框架.研究结果表明:该方法采用过采样平衡数据在流形空间的低维嵌入数据直接完成模式分类,可以减小流形嵌入空间到原始数据空间反映射的计算代价和模式分类成本.另外,流形学习可以有效保持原始数据结构特性,在流形嵌入空间的过采样可以实现更符合
  3. 所属分类:其它

    • 发布日期:2020-06-03
    • 文件大小:641024
    • 提供者:weixin_38507208
  1. 分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料

  2. 分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料,全套学习资料,分子动力学lammps数据分析、二次开发、拉伸摩擦、非平衡统计、自由能计算学习资料,全套学习资料。
  3. 所属分类:C/C++

    • 发布日期:2020-06-01
    • 文件大小:17825792
    • 提供者:qq_43689832
  1. 通信与网络中的分析样本大小对非平衡数据分类的影响

  2. 本文对非平衡类数据分类问题进行了概述。首先在简单介绍非平衡类数据基本概念的基础上,分析了非平衡类数据引起的问题及其导致分类性能下降的原因;然后介绍了目前主要的解决方法,分析了现有处理方法的优缺点;最后讨论了未来的研究方向   普通分类问题中,各个类包含的数据分布比较平衡,稀有类分类问题中,数据的分布极不平衡。例如:将一批医疗数据分类为“癌症患者”和“非癌症患者”两个类,其中 “癌症患者”是小比例样本(假设占总样本的1%),称其为目标类,“非癌症患者”为多数类样本,称为非目标类,从大量数据中正确识
  3. 所属分类:其它

    • 发布日期:2020-10-22
    • 文件大小:184320
    • 提供者:weixin_38743481
  1. 基于混合重采样的非平衡数据SVM训练方法

  2. 针对传统的SVM算法在非平衡数据分类中分类效果不理想的问题,提出一种基于分类超平面和SMOTE过采样方法(HB_SMOTE)。该方法首先对原始训练样本集使用WSVM算法找到分类超平面,然后按一定标准剔除负类中被错分的样本、靠近分类超平面的样本以及远离分类超平面的样本。在UCI数据集上的实验结果表明:与RU_SMOTE等重采样方法相比,HB_SMOTE方法对正类样本和负类样本都具有较高的分类准确率。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:402432
    • 提供者:weixin_38623919
  1. 样本大小对非平衡数据分类的影响

  2. 探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素——样本大小对稀有类的影响进行了研究。
  3. 所属分类:其它

    • 发布日期:2020-10-24
    • 文件大小:191488
    • 提供者:weixin_38748740
  1. 一种用于非平衡数据分类的集成学习模型

  2. 针对非平衡数据分类问题,提出了一种改进的SVM-KNN分类算法,在此基础上设计了一种集成学习模型。该模型采用限数采样方法对多数类样本进行分割,将分割后的多数类子簇与少数类样本重新组合,利用改进的SVM-KNN分别训练,得到多个基本分类器,对各个基本分类器进行组合。采用该模型对UCI数据集进行实验,结果显示该模型对于非平衡数据分类有较好的效果。
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_38564718
  1. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法

  2. 非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(Synthetic Minority Over-Sampling Technique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合成新样本,由此产生过拟合瓶颈.为更好地解决该问题,提出了一种基于单边选择链和样本分布密度的非平衡数据挖掘新方法(One-Sided Link&Distribution Density-SMOTE,OSLDD-SMOTE).OS
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:1048576
    • 提供者:weixin_38602189
  1. 基于NKSMOTE算法的非平衡数据集分类方法

  2. 基于NKSMOTE算法的非平衡数据集分类方法
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:439296
    • 提供者:weixin_38631042
  1. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法

  2. 基于单边选择链和样本分布密度融合机制的非平衡数据挖掘方法
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:1048576
    • 提供者:weixin_38651786
  1. 一种基于核SMOTE的非平衡数据集分类方法

  2. 本文提出一种基于核SMOTE(Synthetic Minority Over-sampling Technique)的分类方法来处理支持向量机(SVM)在非平衡数据集上的分类问题.其核心思想是首先在特征空间中采用核SMOTE方法对少数类样本进行上采样,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练.实验表明,核SMOTE方法所合成的样本质量高于SMOTE算法,从而有效提高SVM在非平衡数据集上的分类效果.
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:543744
    • 提供者:weixin_38742656
  1. 一种用于非平衡数据的SVM学习算法

  2. 在实际应用中的分类数据往往是非平衡数据,少数类别的数据可能有很大的分类代价。分类性能不仅要考虑分类精度,同时要考虑分类代价。该文扩展了支持向量机(SVM)学习方法,对于以高斯核为核函数时的少数类和多数类使用不同的惩罚参数C+,C-以获得高敏感度的超平面,并提出利用遗传算法对SVM的学习参数进行优化调整。给出一种新的评价函数,对分类结果的质量进行评价。实验结果证明,算法对于非平衡数据的分类有较好的效果,对少数类样本预测的准确性较高。
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:1048576
    • 提供者:weixin_38586118
  1. 基于非RAW数据的数码反射显微镜色度特征化

  2. 为了防止彩色数码反射显微镜的白平衡算法失效,提高图像颜色采集精度,提出了基于非RAW数据的数码相机色度特征化方法。首先,利用色卡中性色块建立基于幂函数的非线性校正模型,将非RAW数据转换为与场景辐亮度线性相关的数据。然后,建立色度特征化模型。最后,通过实验测试非RAW数据校正前后的色度特征化精度,并分析光源亮度变化对非线性校正模型及色度特征化精度的影响。结果表明,校正后的非RAW数据将提高色度特征化精度,对于线性色度特征化模型效果尤为明显。同时,光源亮度改变将引起非线性校正模型以及色度特征化精度
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:7340032
    • 提供者:weixin_38627826
  1. 飞秒激光抽运-探测法对金纳米薄膜非平衡传热的研究

  2. 飞秒激光与金属作用后,电子被瞬间加热,电子温度将远远高于声子温度,并逐渐将能量传递给声子,这种非平衡过程中电子和声子间传热能力由电子声子耦合系数表征。而到目前为止电子声子耦合系数是否存在尺度效应还存在争议。采用飞秒激光抽运探测法对金纳米薄膜非平衡传热过程进行了研究,利用抛物两步模型对实验数据进行拟合。通过对不同厚度的金纳米薄膜的电子声子耦合系数的比较,研究表明,电子声子耦合系数随着薄膜厚度的增加而减小。实验结果与已报道的基于电子自由程提出的理论模型所预测的变化趋势相一致。
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:1048576
    • 提供者:weixin_38717156
  1. 分析样本大小对非平衡数据分类的影响

  2. 本文对非平衡类数据分类问题进行了概述。首先在简单介绍非平衡类数据基本概念的基础上,分析了非平衡类数据引起的问题及其导致分类性能下降的原因;然后介绍了目前主要的解决方法,分析了现有处理方法的优缺点;讨论了未来的研究方向   普通分类问题中,各个类包含的数据分布比较平衡,稀有类分类问题中,数据的分布极不平衡。例如:将一批医疗数据分类为“癌症患者”和“非癌症患者”两个类,其中 “癌症患者”是小比例样本(假设占总样本的1%),称其为目标类,“非癌症患者”为多数类样本,称为非目标类,从大量数据中正确识别“
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:178176
    • 提供者:weixin_38536841
  1. 一种新的模糊规则权重方法的非平衡数据分类问题的研究

  2. 针对传统分类算法在处理非平衡数据集所出现的少数类分类准确率较低的问题, 通过引入加权系数和样本 分布函数给出了一种新的模糊规则权重的计算方法. 该方法加强了类间的对比度和差异性, 削弱了类内差距. 将该权 重方法与Chi et al 规则生成算法和模糊分类推理模型结合形成新的分类算法, 对具有不同非平衡度的UCI 数据集进 行Matlab 对比研究, 所得结果验证了该算法的可靠性与有效性.
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:164864
    • 提供者:weixin_38721252
  1. 一种基于GMM-EM的非平衡数据的概率增强算法

  2. 非平衡数据的分类问题是机器学习领域的一个重要研究课题.在一个非平衡数据里,少数类的训练样本明显少于多数类,导致分类结果往往偏向多数类.针对非平衡数据分类问题,提出一种基于高斯混合模型-均值最大化方法(GMM-EM)的概率增强算法.首先,通过高斯混合模型(GMM)与均值最大化算法(EM)建立少数类数据的概率密度函数;其次,根据高概率密度的样本生成新样本的能力比低概率密度的样本更强的性质,建立一种基于少数类样本密度函数的过采样算法,该算法保证少数类数据集在平衡前后的概率分布的一致性,从数据集的统计性
  3. 所属分类:其它

    • 发布日期:2021-01-12
    • 文件大小:327680
    • 提供者:weixin_38712279
« 12 3 4 5 6 7 8 9 10 ... 16 »