您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 决策树算法(matlab)

  2. 对于分类和回归两种 离散属性和连续属性的处理 缺失值的处理
  3. 所属分类:其它

    • 发布日期:2013-10-17
    • 文件大小:5120
    • 提供者:u012475795
  1. 开源力量——数据挖掘原理与实战

  2. 整套大数据课程从hadoop入门开始,由浅入深,内置“hadoop源码解析与企业应用开发实战”,“Hive开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”,“数据挖掘基础。这个系列课程有几个板块组成,所以学员可以按照自己的实际情况选择学习。例如,对于只需要了解hadoop基本编程的人,只需要选择“hadoop源码解析与企业应用开发实战”模块就可以了;对于立志于从事大数据领域的零起点人员,可以选择四个板块依次学习;对于已经有一定基础的hado
  3. 所属分类:Java

  1. 2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课

  2. 2017年最新机器学习入门与实战精品高清全套视频教程附讲义作业(anaconda2 4.3Pytyhon2.7 jupyter) 70课 课程介绍: 从基本的软件安装到必备的Python扩展讲起,然后对机器学习算法一一讲解,同时配合编程实操的实现过程,适合零基础系统学习,配套资料包括讲义作业软件数据都有。 课程目录: 第一章Numpy前导介绍 1.1、Anconda安装 1.2、JupyterNoteBook 1.3、Numpy介绍+ndarry 1.4、ndarry的shape属性巧算 1.
  3. 所属分类:机器学习

    • 发布日期:2018-05-04
    • 文件大小:2048
    • 提供者:happyzhangdi008
  1. 应用预测建模 Applied Predictive Modeling

  2. 译者序 前言 第1章 导论 1.1 预测与解释 1.2 预测模型的关键部分 1.3 专业术语 1.4 实例数据集和典型数据场景 1.5 概述 1.6 符号 第一部分 一般策略 第2章 预测建模过程简介 2.1 案例分析:预测燃油效能 2.2 主题 2.3 总结 第3章 数据预处理 3.1 案例分析:高内涵筛选中的细胞分组 3.2 单个预测变量数据变换 3.3 多个预测变量数据变换 3.4 处理缺失值 3.5 移除预测变量 3.6 增加预测变量 3.7 区间化预测变量 3.8 计算 习题 第4章
  3. 所属分类:机器学习

    • 发布日期:2018-06-14
    • 文件大小:77594624
    • 提供者:u011051172
  1. 机器学习-检测webshell

  2. 基于决策树的webshell检测,k-近邻算法是基于实例的学习,使用算法时我们必须有接近实际数据 的训练样本数据,k-近邻算法必须报错全部数据集,如果训练数据集的很大 必须使用大量的存储空间,此外,由于必须对数据集中的每个数据计算距离, 实际使用可能非常耗时 k-近邻算法的另一个缺陷时它无法给出任何数据的基础结构信息,因此我们也无法知晓 平均实例样本和典型实例样本具有什么特征。 决策树也是最经常使用的数据挖掘算法 决策树的优势在于数据形式非常容易理解 决策树的一个重要任务时为了数据中所蕴含的知
  3. 所属分类:机器学习

    • 发布日期:2018-07-18
    • 文件大小:460800
    • 提供者:qq_32170843
  1. 机器学习算法基础学习总结

  2. 机器学习算法基础学习总结2.基本算法 2.1 Logistic回归 优点:计算代价不高,易于理解和实现。 缺点:容易欠拟合,分类精度可能不高 适用数据类型:数值型和标称型数据。 类别:分类算法。 试用场景:解决二分类问题。 简述: Logistic回归算法基于 Sigmoid函数,或者说 Sigmoid就是逻辑回归函数。 Sigmoid函数定义如下:1/(1-exp(-z))。函数值域范围(0,1)。可以用来做分 类器。 Sigmoid函数的函数曲线如下: 逻辑凹归模型分解如下:(1)首先将不同
  3. 所属分类:机器学习

    • 发布日期:2019-07-02
    • 文件大小:312320
    • 提供者:abacaba
  1. Python机器学习之决策树算法实例详解

  2. 本文实例讲述了Python机器学习之决策树算法。分享给大家供大家参考,具体如下: 决策树学习是应用最广泛的归纳推理算法之一,是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。决策树可以使用不熟悉的数据集合,并从中提取出一系列规则,机器学习算法最终将使用这些从数据集中创造的规则。决策树的优点为:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点为:可能产生过度匹配的问题。决策树适于处理离散型和连续型的数据。 在决策树中最重要的就是如何选取
  3. 所属分类:其它

    • 发布日期:2020-12-25
    • 文件大小:83968
    • 提供者:weixin_38643212
  1. python编写分类决策树的代码

  2. 决策树通常在机器学习中用于分类。 优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题。 适用数据类型:数值型和标称型。 1.信息增益 划分数据集的目的是:将无序的数据变得更加有序。组织杂乱无章数据的一种方法就是使用信息论度量信息。通常采用信息增益,信息增益是指数据划分前后信息熵的减少值。信息越无序信息熵越大,获得信息增益最高的特征就是最好的选择。 熵定义为信息的期望,符号xi的信息定义为: 其中p(xi)为该分类的
  3. 所属分类:其它

    • 发布日期:2020-12-23
    • 文件大小:68608
    • 提供者:weixin_38681318
  1. 决策树缺失值处理

  2. 决策树 1.决策树缺失值处理 1.1对于训练模型,训练数据部分样本的部分特征值缺失的情况下,做法是:把该数据按比例分成三份数据。可以算出该特征的信息增益。 1.2对于预测数据,C4.5中采用的方法是:测试样本在该属性值上有缺失值,那么就同时探查(计算)所有分支,然后算每个类别的概率,取概率最大的类别赋值给该样本。 1.3测试样本属性也有缺失值那要怎么办? 有论文里讨论过: 2.决策树应用的案例: import csv from sklearn.feature_extraction import
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:50176
    • 提供者:weixin_38654380
  1. 基于马尔可夫检测树的集中式方案,用于自动识别云平台上的恶意网页

  2. 有效检测恶意网页对于确保Internet上的Web.security至关重要。 但是,现有方法的检测结果差,效率低,因此,设计一种能够提高恶意网页分类精度的有效检测方案具有重要的挑战。 为了克服这一挑战,本文提出了一种马尔可夫检测树方案,对恶意网页进行自动识别和分类,其中统一资源定位符的链接关系,信息获取率,马尔可夫决策过程以及决策树为用于同时分析恶意网页。 为了提高检测的准确性,针对恶意网页,提出了两种填充缺失值的方法来处理网页的null属性值。我们比较了应用不同方法时算法的性能。分类准确性和
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:1048576
    • 提供者:weixin_38734008
  1. Titanic-源码

  2. 泰坦尼克号 一个分类问题,与预测泰坦尼克号沉没灾难中的乘客的生存情况有关。 通过查看,分析和可视化具有因变量(即“生存”)的不同特征之间的关系和估计效果来开始问题。 通过各种图表(如直方图,条形图,使用matplotlib和seaborn库的点图)可视化每个变量。 通过使用数字数据类型的均值和分类数据类型的均值填充具有缺失值的要素来完成训练和测试数据集。 执行特征工程以排除在预测中具有可忽略的重要性的特征。 使用一键编码处理分类变量。 使用Logistic回归(准确度分数= 0.8),决策树(准
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:2048
    • 提供者:weixin_42097967
  1. USA_HousesSalePrice-RegClas:Python scikit机器学习决策树和随机森林算法,用于对美国房屋的销售价格进行回归和分类-源码

  2. USA_HousesSalePrice-RegClas Python机器学习决策树和随机森林算法,用于对美国房屋的销售价格进行回归和分类。 在这个Jupyter笔记本中,我使用Python Pandas和Sklearn模块进行了数据集分析,并处理了USA Housing Dataset( )的缺失值。 我在回归和分类问题上都实现了这两种算法,并在笔记本结尾比较了这两种算法的结果。
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:240640
    • 提供者:weixin_42097508
  1. 数据科学微型项目:比较决策树回归,随机森林和多元线性回归的准确性-源码

  2. 数据科学迷你项目 决策树回归,随机森林和多元线性回归的精度比较 风险资本家雇用您来预测一家初创公司的利润。 因此,您必须处理一个数据集,该数据集包含50个创业公司的详细信息,并根据某些功能预测新创业公司的利润。 根据您的决定和预测,是否应该投资特定的创业公司。 数据集包含以下字段:研究与发展趋势-研发管理支出总额-行政管理支出支出总额-营销市场支出总额-创业公司运营的州利润-获利启动 在应用机器学习算法之前,您必须执行以下任务:1)处理缺失值2)准备数据进行训练和测试3)应用决策树算法训练模型
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:66560
    • 提供者:weixin_42134769
  1. 决策树约束的建筑点云提取方法

  2. 作为城市主体,建筑物信息的提取一直是国内外学者研究的热点。针对目前机载激光点云数据量大、建筑点云提取不完整等难题,提出一种面向对象构建决策树的建筑点云高精度提取方法。决策树可以同时处理多种数据属性,并且对缺失值不敏感,利用点云中每个对象属性与对应各个特征值之间的映射关系,结合每个激光脚点与其邻域关系、高程均值等特征,为决策树每个内部节点生成建筑物点的判定条件,然后比较所有分类特征对应的点集不确定性(熵),确定最优特征及最优候选值,有监督地从样本数据中学习得到正确的分类器,进而完成待处理点云中建筑
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:7340032
    • 提供者:weixin_38680957
  1. python决策树之C4.5算法详解

  2. 本文为大家分享了决策树之C4.5算法,供大家参考,具体内容如下 1. C4.5算法简介   C4.5算法是用于生成决策树的一种经典算法,是ID3算法的一种延伸和优化。C4.5算法对ID3算法主要做了一下几点改进:   (1)通过信息增益率选择分裂属性,克服了ID3算法中通过信息增益倾向于选择拥有多个属性值的属性作为分裂属性的不足;   (2)能够处理离散型和连续型的属性类型,即将连续型的属性进行离散化处理;   (3)构造决策树之后进行剪枝操作;   (4)能够处理具有缺失属性值的
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:143360
    • 提供者:weixin_38728347
  1. 决策树的python实现方法

  2. 本文实例讲述了决策树的python实现方法。分享给大家供大家参考。具体实现方法如下: 决策树算法优缺点: 优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据 缺点:可能会产生过度匹配的问题 适用数据类型:数值型和标称型 算法思想: 1.决策树构造的整体思想: 决策树说白了就好像是if-else结构一样,它的结果就是你要生成这个一个可以从根开始不断判断选择到叶子节点的树,但是呢这里的if-else必然不会是让我们认为去设置的,我们要做的是提供一种方法,计算机可以根
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:71680
    • 提供者:weixin_38716081