第一章:大数据与云计算 1.何为大数据? 海量数据或巨量数据,其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。 2.大数据具有4V+1C的特征 (1)数据量大:存储的数据量巨大,PB级是常态 (2)多样:数据的来源及格式多样 (3)快速:数据增长速度快 (4)价值密度低:需要对大量的数据进行处理,挖掘其潜在的价值。 (5)复杂度:对数据的处理和分析的难度大 3.什么是云计算? 长定义:云计算是一种商业模型。它将计算任务分布在大量计算机构成的资源池