大数据详细项目简历:
离线项目:于用户行为标签的智能气象服务系统
个人职责:
1.运用Flume采集源数据,存放于Kafka消息队列中
2.采用Kstream框架对数据进行初步数据清洗与变换,使用Java API将数据导入HBase
3.使用Hive集成Hbase,对数据进行ETL,进一步清洗处理数据
4.协助使用Hive提取特征值,运用Spark ML构建模型
5.参与模型检验与随机森林算法调优
6.参与编写脚本文件将数据导出到MySQL中,运用Tableau工具进行可视化分析
参与编写部分O