写一些关于数据仓库里面,数据集市(画像层)的东西吧
最近一直都没写文章,因为太忙了,公司很多事情,主要画像层的一些重构,搞得我死去活来,所以写一篇文章给大家分享一下,如何构建一个良好的数据集市。
情况呢是这样的,现在有很多的B端画像(交易,流量,什么的这种),但是呢,这些个画像,几年前就构建好了,而且SQL写的极其复杂,导致SLA已经很晚了,所以要优化重构。我这里主要说几点吧。
1.中间表尽量少——为什么这么说呢,因为我在重构的过程中发现,之前的那些个SLA超级晚的画像,用了大量的中间表,一张画