列式数据库优缺点

  列式数据库从一开始是面向大数据环境下数据仓库的数据分析而产生,它跟行式数据库相比当然也有一些前提条件和优缺点。

  列式数据库优点:

  极高的装载速度 (高可以等于所有硬盘IO 的总和,基本是极限了)

  适合大量的数据而不是小数据

  实时加载数据于增加(删除和更新需要解压缩Block 然后计算然后重新压缩储存)

  高效的压缩率,不仅节省储存空间也节省计算内存和CPU。

  非常适合做聚合操作。

  缺点:

  不适合扫描小量数据

  不适合随机的更新

  批量更新情况各异,有的优化的比较好的列式数据库(比如Vertica)表现比较好,有些没有针对更新的数据库表现比较差。

  不适合做含有删除和更新的实时操作。

  常见误区

  一个常见的误区认为如果每次扫描较多行或者全列全表扫描的时候,行式数据库比列式数据库更有优势。事实上这只是行式数据库认识上的一个误区,即认为列式数据库的主要优势在于其列分开储存,而忽略了列式数据库上面提到的其他几大特征,这个才是列式数据库高性能的核心。