一.用户聚类分析
1.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区
2.选取算法:聚类算法-KMeans
3.确定聚类个数(6个)
4.通过训练模型形成中心点
5.对用户进行聚类
二.性别预测
1.理解需求:行为性别(男(1),女(0))
2.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区
3.选算法:分类算法(朴素贝叶斯)
4.获取经验样本:打上类别标签(抽取数据,人工打上标签--男--女)
5.评估模型效果(用样本中一部分数据