GBase 8c 存储
GBase 8c数据库支持行列混合存储。行、列存储模型各有优劣,建议根据实际情况选择。通常默认使用行存储,适用于TP场景,仅对执行复杂查询且数据量大的AP场景时,才使用列存储。
行存储是指将表按行存储到硬盘分区上,列存储是指将表按列存储到硬盘分区上。默认情况下,创建的表为行存储。
行、列存储优缺点,如表1所示。
表1 存储模型及优缺点
存储模型
优点
缺点
行存
数据被保存在一起。INSERT/ UPDATE容易。
选择(Selection)时即使只涉及某几列,所有数据也都会被读取。
列存
l 查询时只有涉及到的列会被读取。
l 投影(Projection)很高效。
l 任何列都能作为索引。
l 选择完成时,被选择的列要重新组装。
l INSERT/UPDATE比较麻烦。
一般情况下,如果表的字段比较多(大宽表),查询中涉及到的列不多的情况下,适合列存储。如果表的字段个数比较少,查询大部分字段,那么选择行存储比较好。
表2 存储模型及适用场景
存储类型
适用场景
行存
点查询(返回记录少,基于索引的简单查询)。
增、删、改操作较多的场景。
列存
统计分析类查询 (关联、分组操作较多的场景)。
即席查询(查询条件不确定,行存表扫描难以使用索引)。