大数据不仅为我们带来不断增长的数据量,动态和弹性的存储需求,多样化的数据结构,还为我们带来了不同的数据功能。 除了传统的密集数据外,越来越多的“稀疏”数据应运而生,并占了海量数据的大部分。 如何适应稀疏数据的特性而又不忽视密集数据的特性是一个挑战。 为了满足不同的存储需求并提供表达缺失值语义的正确方法,我们提出了一种称为“动态表”的三层存储结构来表示不完整的数据。 我们的该方法针对云中的分布式存储需求进行了研究,旨在支持行和列的混合布局,该布局允许用户按需混合和匹配两种物理存储格式。 此外,缺失