实例如下:
# -*- coding:utf-8 -*-
from numpy import *
import numpy as np
import pandas as pd
from math import log
import operator
#计算数据集的香农熵
def calcShannonEnt(dataSet):
numEntries=len(dataSet)
labelCounts={}
#给所有可能分类创建字典
for featVec in dataSet:
本文实例为大家分享了python实现ID3决策树算法的具体代码,供大家参考,具体内容如下
'''''
Created on Jan 30, 2015
author: 史帅
'''
from math import log
import operator
import re
def fileToDataSet(fileName):
'''''
此方法功能是:从文件中读取样本集数据,样本数据的格式为:数据以空白字符分割,最后一列为类标签
参数:
fileName