如图所示便是魅族的大数据平台架构。左边是多样性的数据源接入;右上是离线数据的采集;下面是流平台(也是今天分享的主角);中间是集群的部署;右边是ETL的数据挖掘、算法库和一些数据模型;左上角是数据开发平台,比如webIDE可以使得开发人员更便捷地做一些数据查询和管理;最右边的是一个数据产品门户,包括我们的用户画像、统计系统等,这里面包含大数据的很多组件,比如数据采集、数据处理、数据存储、数据挖掘等,最后产生大数据的雏形。流平台是大数据平台一个比较重要的部分,主要包括四个部分:数据采集、数据处理、数