PostgreSQL TOAST技术解析

一、TOAST是什么？

TOAST是“The Oversized-Attribute Storage Technique”（超尺寸字段存储技术）的缩写，主要用于存储一个大字段的值。

要理解TOAST，我们要先理解页（BLOCK）的概念。在PG中，页是数据在文件存储中的基本单位，其大小是固定的且只能在编译期指定，之后无法修改，默认的大小为8KB。同时，PG不允许一行数据跨页存储。那么对于超长的行数据，PG就会启动TOAST，将大的字段压缩或切片成多个物理行存到另一张系统表中（TOAST表），这种存储方式叫行外存储。

二、四种TOAST的策略

PLAIN：避免压缩和行外存储。只有那些不需要TOAST策略就能存放的数据类型允许选择（例如int类型），而对于text这类要求存储长度超过页大小的类型，是不允许采用此策略的
EXTENDED：允许压缩和行外存储。一般会先压缩，如果还是太大，就会行外存储
EXTERNA：允许行外存储，但不许压缩。类似字符串这种会对数据的一部分进行操作的字段，采用此策略可能获得更高的性能，因为不需要读取出整行数据再解压。
MAIN：允许压缩，但不许行外存储。不过实际上，为了保证过大数据的存储，行外存储在其它方式（例如压缩）都无法满足需求的情况下，作为最后手段还是会被启动。因此理解为：尽量不使用行外存储更贴切。现在我们通过实际操作来研究TOAST的细节：

interger默认TOAST策略为plain，而text为extended。PG资料告诉我们，如果表中有字段需要TOAST，那么系统会自动创建一张TOAST表负责行外存储，那么这张表在哪里？

通过上诉语句，我们查到blog表的oid为16441，其对应TOAST表的oid为16444，那么其对应TOAST表名则为：pg_toast.pg_toast_16441（注意这里是blog表的oid），我们看下其定义：

TOAST表有3个字段：

chunk_id：用来表示特定TOAST值的OID，可以理解为具有同样chunk_id值的所有行组成原表（这里的blog）的TOAST字段的一行数据
chunk_seq：用来表示该行数据在整个数据中的位置
chunk_data：实际存储的数据。现在我们来实际验证下:

可以看到，直到content的长度为327680时（已远远超过页大小8K），对应TOAST表中才有了2行数据，且长度都是略小于2K，这是因为extended策略下，先启用了压缩，然后才使用行外存储

下面我们将content的TOAST策略改为EXTERNA，以禁止压缩。

这次我们看到当content长度达到2560（按照官方文档，应该是超过2KB左右），TOAST表中产生了新的2条chunk_id为16448的行，且2行数据的chunk_data的长度之和正好等于2560。通过以上操作得出以下结论：

如果策略允许压缩，则TOAST优先选择压缩
不管是否压缩，一旦数据超过2KB左右，就会启用行外存储
修改TOAST策略，不会影响现有数据的存储方式

posted @ 2022-02-10 10:28 数据库集中营阅读(984) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· PostgreSQL处理膨胀与事务回卷

· PostgreSQL 修改执行计划 GroupAggregate 为 HashAggregate

· TOAST技术

· toast简介

· PostgreSQL的TOAST表

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· .NET10 - 预览版1新功能体验（一）

公告

昵称：数据库集中营
园龄： 3年4个月
粉丝： 6
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:PostgreSQL大表count方法总结及优化探讨
索引字段可以为null，且会走索引，试过了
--chjiyun
2. Re:Postgresql 锁等待检测及处理
资瓷，
--Empirefree

AI FOR CODE 大赛