您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 菊安酱的机器学习第1期-k-近邻算法(直播).pdf

  2. k-近邻算法的课件。来自于菊安酱的机器学习实战12期的免费教程。内涵python源码。菊安酱的直播间: 我们已经知道k近邻算法的工作原理,根据特征比较,然后提取样本集中特征最相似数据(最近邻)的分类标签。 那么如何进行比较呢?比如表1中新出的电影,我们该如何判断他所属的电影类别呢?如图2所示。 电影分类 120 爱情片(1,101) 爱情片(12,97) 80 爱情片(5,89) 水弊 60 ?(24,67) 动作片(112,9 20 动作片(1158) 动作片(108,5) 0 20 60 8
  3. 所属分类:讲义

    • 发布日期:2019-07-27
    • 文件大小:867328
    • 提供者:qiu1440528444
  1. knn算法详解(附练习代码)

  2. KNN算法 KNN算法是一个用于对数据样本进行分类预测的算法 KNN算法就是根据样本之间的距离,来对新的样本来进行分类 计算过程:将新的样本点,与历史样本点中的每一个样本点进行距离的计算 取前k个距离最近的样本点的分类结果 取分类结果频次最好的二分类项作为新样本的分类。 网络搜索:手动指定不同参数的检索范围,通过网络搜索来寻找最优的超参数或者模型参数 K就表示要取离新样本最近的K个样本进行分类决策 通常我们只提供已有数据的 90 %作为训练样本来训练分类器 ,而使用其余的 10% 数据去测试分
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:76800
    • 提供者:weixin_38617604
  1. knn算法详解(附练习代码)

  2. KNN算法 KNN算法是一个用于对数据样本进行分类预测的算法 KNN算法就是根据样本之间的距离,来对新的样本来进行分类 计算过程:将新的样本点,与历史样本点中的每一个样本点进行距离的计算 取前k个距离最近的样本点的分类结果 取分类结果频次最好的二分类项作为新样本的分类。 网络搜索:手动指定不同参数的检索范围,通过网络搜索来寻找最优的超参数或者模型参数 K就表示要取离新样本最近的K个样本进行分类决策 通常我们只提供已有数据的 90 %作为训练样本来训练分类器 ,而使用其余的 10% 数据去测试分
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:76800
    • 提供者:weixin_38500948
  1. 机器学习“傻瓜式”理解(4)KNN算法(数据处理以及超参数)

  2. 数据处理以及超参数的理解 首先我们需要了解到,我们在进行机器学习的过程中寻求的不是让训练处的在现有的数据集上达到最佳,而是我们需要让其在真实环境中达到最佳的效果。在上一节中我们将全部的数据集全部用于训练模型中,对于我们所训练出的模型无法知道其具体的准确度便投入真实环境使用,这样的做法极具风险性,而且我们也不推荐。 解决方案:机器学习最常用的解决方案便是实现测试集和训练集的相互分离(此方法仍具有局限性,后续会补充)。具体的操作方式是:将全部数据集的80%当做训练数据集,训练出来模型后我们通过另外2
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:727040
    • 提供者:weixin_38721252
  1. 机器学习“傻瓜式”理解(4)KNN算法(数据处理以及超参数)

  2. 数据处理以及超参数的理解 首先我们需要了解到,我们在进行机器学习的过程中寻求的不是让训练处的在现有的数据集上达到最佳,而是我们需要让其在真实环境中达到最佳的效果。在上一节中我们将全部的数据集全部用于训练模型中,对于我们所训练出的模型无法知道其具体的准确度便投入真实环境使用,这样的做法极具风险性,而且我们也不推荐。 解决方案:机器学习最常用的解决方案便是实现测试集和训练集的相互分离(此方法仍具有局限性,后续会补充)。具体的操作方式是:将全部数据集的80%当做训练数据集,训练出来模型后我们通过另外2
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:727040
    • 提供者:weixin_38675506
  1. KNN(K最近邻)分类算法_糖潮丽子的博客

  2. 我们本篇博客来学习KNN算法的原理,超参数调整,以及KNN算法应用。 kNN算法:K最近邻(kNN,k-NearestNeighbor)分类算法。 KNN算法1、算法概述2、举例3、加深理解4、算法原理5、算法超参数5.1 K值5.2 关于K的取值5.3 距离度量方式5.4 权重计算方式6、算法步骤7、使用KNN实现分类7.1 建模预测7.2 超参数对模型的影响7.3 超参数调整8、使用KNN回归预测8.1 建模预测8.2 数据标准化8.3 流水线9、KD树10、总结 1、算法概述 邻近算法,
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:886784
    • 提供者:weixin_38701156
  1. 基于Python实现 KNN 算法和 Decision Trees 算法

  2. (⼀) 在 jupyter notebook 中,实现 KNN 算法和 Decision Trees 算法,要求有完整的注释 (⼆) ⼿手写数字识别 样本中包含1797个⼿手写数字灰度图像,每个图像⼤大⼩小为8*8,可使⽤用 numpy.load('filename.npy') 进 ⾏行行载⼊入 使⽤用留留出法拆分训练集与测试集,留留出10%作为测试集。训练KNN模型,搜索最佳的超参数k和n的取值,提 升识别准确度
  3. 所属分类:专业指导

    • 发布日期:2020-12-20
    • 文件大小:76800
    • 提供者:weixin_44348354
  1. Adult-Teenager-Classification-using-Deep-Learning-源码

  2. 使用深度学习的青少年分类 问题陈述 通过使用具有不同矢量化器的各种模型,我想通过分析用户在不同子reddit中使用的词来确定模型是否可以准确预测用户的成熟度/年龄。 我将从每个subreddit,r /​​ Teenagers和r / Adulting收集5,000行数据,并使用这些数据来训练我的朴素贝叶斯和KNN模型。 我的目的是确定在两个子Reddit中的任何一个中使用的关键字,创建停用词,并确定模型中的最佳超参数。 使用的内容和数据 笔记本(按顺序) 数据采集 Adulting_Data
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:4194304
    • 提供者:weixin_42097450
  1. Veeresh_Portfolio:数据科学项目-源码

  2. Veeresh_Portfolio 数据科学项目 建立了用于分类不同类型葡萄酒品牌的神经网络模型。 已调整模型使用各种超参数调整方法来获得最佳精度 建立了一个LSTM模型,如果我们提供输入文本数据,该模型将生成文本输出 建立模型并在Google Colab中训练模型 下载数据,清理数据并应用Count Vectorizer方法 建立了一个ANN模型对文本数据进行分类。 已调整模型使用各种超参数调整方法来获得最佳精度 下载数据,使用Minmax缩放器清理数据并缩放数据 建立LSTM模型并在火
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:494592
    • 提供者:weixin_42106357
  1. ml-knn-bayes:朴素贝叶斯和KNN分类器,机器学习-源码

  2. 朴素贝叶斯和KNN分类器,ML 使用KNN和朴素贝叶斯(Naive Bayes)作为算法从头构建分类器。 这些分类器的构造使用相同的算法,但是现在使用了Scikit-Learn实现。 评估和比较从头开始实施的内容与通过Scikit-Learn获得的内容之间的比较。 学习成功是通过对评估集上的分类器进行评估,经过验证阶段以获得最佳超参数并利用交叉验证来衡量的。 该项目的详细说明在实验室“ knn-bayes-lab”中。 合作者 塞巴斯蒂安·沃尔蒂(SebastiánVolti) 亚历杭德罗·
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:1048576
    • 提供者:weixin_42150360
  1. SpringBoard:SpringBoard数据科学的项目和任务-源码

  2. 跳板 SpringBoard数据科学的项目和作业 SQL分配[SQL] SQLTasks Tier 2.sql :使用PHPMyAdmin解决的问题1-9的答案 sqlite.ipynb :回答问题10-13,涉及使用python sqlite3接口。 网格搜索KNN研究[Grid_Search_KNN] GridSearchKNN_Case_Study.ipynb :用于分配的ipython笔记本。 data :分配的相关数据 贝叶斯超参数优化[Bayes_Optimization]
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:5242880
    • 提供者:weixin_42136365
  1. housing_prices:在多个回归模型中使用交叉验证和网格搜索对房屋市场价格进行分析和预测-源码

  2. 在回归模型中使用交叉验证和网格搜索预测房价 在多个回归模型中使用交叉验证和网格搜索对房屋市场价格进行分析和预测 该项目的目标 在本文中,我将分析与墨尔本房价相关的因素,并使用几种机器学习技术对房价进行预测。 该分析中使用的模型是线性回归,岭回归,K最近邻(以下称为KNN)和决策树。 使用交叉验证和网格搜索技术的方法,我找到了每个模型中超参数的最佳值,然后比较结果以找到最佳的机器学习模型来预测墨尔本的房价。 如何运行这个项目 安装Python 3。 安装Jupyter Notebook。 使用
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:6291456
    • 提供者:weixin_42116058
  1. bestK-kNN:使用自制的kNN,使用kNN查找最低损失的最佳K超参数-源码

  2. 最佳K-kNN Py程序找到运行K-NN的最佳K超参数,基于最低的精度损失来选择最优。 用法 可以在中找到正在使用的示例,该函数的调用如下所示: bestK(X,Y,maxK,maxRow) most_common_k(array) 其中数组保存了K的不同范围内的所有损耗 特征 X和y分别是特征和目标值maxK是在上进行优化的最大K个最近邻居maxRow是X中要在其上运行kNN的行数 结果 对于通用函数调用,结果如下 bestK(X, Y, 10, 50) most_common_k(arr
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:31744
    • 提供者:weixin_42118160
  1. pyAudioProcessing:音频特征提取和分类-源码

  2. pyAudioProcessing 一个基于Python的库,用于将音频数据处理为特征并构建机器学习模型。 入门 克隆项目并进行设置 git clone gitgithub.com:jsingh811/pyAudioProcessing.git pip install -e . 通过运行获取需求 pip install -r requirements/requirements.txt 选择项 功能选项: 您可以选择mfcc , gfcc或gfcc,mfcc功能从音频文件中提取。 分类器选项:
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:22020096
    • 提供者:weixin_42171208
  1. insurance_cross_sell:使用ML向健康保险客户交叉销售汽车保险-源码

  2. 交叉销售汽车保险 该项目使用机器学习来预测当前的健康保险客户是否会购买汽车保险。 基础数据是从Kaggle获得的,其中包含有关先前销售的信息。 在测试各种分类器(包括逻辑回归,支持向量分类器,KNN分类器和随机森林分类器)之前,使用SMOTENC对数据进行了转换和上采样。 在使用默认的超参数对分类器进行测试之后,进行了网格搜索以识别最佳的超参数组合。
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:6291456
    • 提供者:weixin_42134094
  1. Reddit-NLP-源码

  2. 项目3:Web API和NLP 问题陈述 通过使用带有不同矢量化器的各种模型,我想通过分析用户在不同子reddit中使用的词来确定模型是否可以准确预测用户的成熟度/年龄。 我将从每个subreddit,r /​​ Teenagers和r / Adulting收集5,000行数据,并使用这些数据来训练我的朴素贝叶斯和KNN模型。 我的目标是确定在两个子Reddit中的任何一个中使用的关键字,创建停用词,并确定模型中的最佳超参数。 使用的内容和数据 笔记本(按顺序) 数据采集 Adulting_D
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:5242880
    • 提供者:weixin_42128015
  1. ML-Predictions:机器学习引擎使用回归功能在给定任何数据集的情况下生成预测-源码

  2. 机器学习-预测 Travic CI构建状态: 目录 第0章-关于 机器学习引擎使用回归在给定任何数据集的情况下生成预测。 技术:预测算法熊猫数据框相似度度量matplotlib根均值平方误差度量多元模型scipy scikit-learn超参数优化交叉验证aws-lambda线性回归knn回归logistic回归单元测试连续积分二进制分类k均值聚类相关sklearn多分类 由于我们要通过使用选定的训练/测试验证基于选定的训练特征列表来预测给定数据集的选定目标特征(列)的特定最佳数值,因此使用回
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:1048576
    • 提供者:weixin_42168830
  1. exoplanet-spectra-源码

  2. 机器学习对系外行星的分类 包装概述 generate_data.py 生成综合数据集 grid_search.py 超参数调整 classifier.py 所有分类器的父类。 容器功能,用于评估预测 机器学习算法 线性判别分析(LDA) K最近邻居(KNN) 分类和回归树(CART) 逻辑回归(LR) 朴素贝叶斯分类器(NB) 支持向量机(SVM) 随机森林(RF) 硬多数投票(HMV) 软多数投票(SMV)
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:10485760
    • 提供者:weixin_42130786
  1. Dataquest-源码

  2. 此存储库包含RDSA Dataworks项目的所有注释:Dataquest-中级流 关于DataWorks Data Works是一个为期3个月的计划,旨在让Ryerson学生通过使用名为Kaggle的在线学习平台构建3个入门项目,从而获得对数据科学的入门理解,同时也是一个懈怠的社区,为他们的项目提供帮助。 我们的计划任务为参与者提供在数据科学领域入门所需的社区,资源和技能。 程序结构这个为期7周的计划旨在通过最后的展示为您提供学习Python和机器学习的经验。 包括: 命令和说明 每个
  3. 所属分类:其它

    • 发布日期:2021-03-30
    • 文件大小:12288
    • 提供者:weixin_42168341
  1. Jonathan_Lynch:数据科学组合-源码

  2. 对世界各国的数据集进行了探索性数据分析(EDA) 使用核密度估计(KDE)分析数据子集的分布 利用相关矩阵热图和散点图评估相关性 开发线性回归和随机森林回归模型以预测人均GDP 使用奥运奖牌数据集通过可视化方式讲述了一个引人入胜的故事 创建了一个树形图,堆积的条形图和小的倍数躲避的条形图,以及 设计了六个国家/地区随时间推移赢得的总奖牌 对酒店预订需求数据集进行了初步探索 构造的多项式朴素贝叶斯,KNN,SVM和随机森林分类器 利用网格搜索调整单个模型的超参数 使用接收器工作特性(ROC)
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:4194304
    • 提供者:weixin_42128141
« 12 »