本文来自于fujiabin,本篇会使用scikit-learn这个开源机器学习库来对iris数据集进行分类练习。我将分别使用两种不同的scikit-learn内置算法——DecisionTree(决策树)和kNN(邻近算法),随后我也会尝试自己实现kNN算法。目前为止,我还是在机器学习的入门阶段,文章中暂不详细解释算法原理,如果想了解细节信息可自行搜索。scikit-learn中预制了很多经典数据集,非常方便我们自己练习用。使用方式也很容易:
load_iris返回的结果有如下属性:featur