易企|僵尸企业分类系统
该项目是2020年第十一届中国大学生服务外包创新创业大赛A09赛题-僵尸企业画像及分类我们团队提交作品的源码。该项目主要任务是要根据给定的企业信息,进行二分类,判断是僵尸企业和非僵尸企业。
本项目分为两部分,第一部分是机器学习训练模型,业务与统计两个角度构造特征,使用RFECV作特征筛选,算法主要使用决策树,随机森林与XGBoost,网格搜索五折交叉参数调优,并使用投票分类器融合,权重使用遗传算法确定,并造成数据融合。第二部分是Web可视化界面,用于支持拆分和批量企业信息