数据分析与数据挖掘的方法
1.频繁模式
频繁模式:数据中频繁出现的模式。
频繁项集:频繁在事务数据集中一起出现的商品集合。
例如,信用卡分析、患者就诊分析、购物车分析…
2.分类与回归
分类与标签预测是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标识未知的对象的类标号。
分类预测类别(离散的、无序的)标号,回归建立连续值函数模型,也就是用来预测缺失的或难以获得的数值数据值。
典型方法:决策树、朴素贝叶斯分类、支持向量机、神经网络、规则分类器、基于模式的分类、逻辑回归…
3.聚类