PostgreSQL 9.3.1 中文手册
上一页	上一级	章 58. 数据库物理存储	下一页

58.6. 数据库页布局

本节对PostgreSQL中表和索引使用的页格式进行介绍。[1] 序列表和TOAST表的格式与普通表类似。

下面说明一下，一个字节假定为包含8个比特位。另外，术语项为存储在页上的一个独立数据值。在表中，一项是一行；在索引中，一项为一个索引条目。

每个表和索引存储为页的数组，页的大小固定（通常 8 kB，不过当编译服务器的时候，可以选择不同的页大小）。在表中，所有的页是逻辑等价的，所以一个特殊项（行）可以存储在任意页。在索引中，第一页通常保留为持有控制信息的元页，这里可以有不同类型的索引页，这依赖于索引访问方法。

表 58-2为一个页的整体布局，每页有5部分。

表 58-2. 页整体布局

项	描述
PageHeaderData	24字节长整型。包含关于页的一般信息，包括空闲空间指针。
ItemIdData	指向实际项的（偏移量，长度）数组对。每项4字节。
Free space	未分配空间。从这个区域开始分配新项指针，从结尾开始分配新项。
Items	实际项本身
Special space	索引访问方法专用数据。不同方法存储不同的数据。对于普通表该区域为空。

每页的前24个字节构成一个页头（PageHeaderData）。在表 58-3有它的详细格式。前两个字段跟踪该页最近的WAL条目。下边的一个2字节的字段包含标志位。随后有3个2字节整数字段（pd_lower, pd_upper, 和pd_special）。这些字段分别表示从页开始位置至未分配空间的开始，未分配空间的结束，专用空间的开始处的偏移字节数。页头中随后的2字节，pd_pagesize_version，存储页大小和版本指示符。从PostgreSQL 8.3开始版本编号是4； PostgreSQL 8.1和8.2使用版本编号3； PostgreSQL 8.0使用版本编号2； PostgreSQL 7.3和7.4使用版本编号1；先前发布版本使用版本编号0。（在大多数这些版本中，基本的页布局和头格式没有变化，但是堆的行头有变化.）页面的大小基本上只用于交叉检查；在安装的版本中，不支持多种页面大小。最后一个字段是个提示，显示是否整理页可能是有利的，它跟踪该页上最旧的未整理的XMAX。

表 58-3. PageHeaderData布局

字段	类型	长度	描述
pd_lsn	XLogRecPtr	8字节	LSN: 该页上最后的变化对应的xlog记录的最后字节的下一字节
pd_tli	uint16	2字节	最后变化对应的时间线ID（仅其最低16位）
pd_flags	uint16	2字节	标志位
pd_lower	LocationIndex	2字节	到空闲空间开始处的偏移量
pd_upper	LocationIndex	2字节	到空闲空间结尾处的偏移量
pd_special	LocationIndex	2字节	到专用空间开始处的偏移量
pd_pagesize_version	uint16	2字节	页大小和布局版本号信息
pd_prune_xid	TransactionId	4字节	页上最旧的未修整的XMAX，如果没有则为零。

在src/include/storage/bufpage.h可以找到所有的详细信息。

紧挨着页头的是项标识符（ItemIdData），每个4字节。一个项标识符包含一个到项开始的字节偏移，其长度以字节计，和一些影响它解释的属性位。新项标识符需要从未分配空间的开始处分配。可以通过查看pd_lower来确定项标识符的数量，分配新的项标识符时， pd_lower会随之增加。因为一个项标识符从来不移动直到释放了它，即使为了紧凑空闲空间，项本身被移除，引用该项的索引可以长期被使用。实际上， PostgreSQL创建的每个指向项的指针（ItemPointer，也称之为CTID，是由页号和项标识符索引组成的。

项本身从未分配空间的结尾处开始反向存储。确切的结构取决于包含什么表。表和序列两者都使用一个名为HeapTupleHeaderData的结构，下面描述。

最后的段是"特殊段"，其可以包含任何想存放访问方法。例如，b-tree索引存储指向该页左右兄弟的连接，以及相应索引结构的一些其它数据。普通表不使用特殊段（通过设置pd_special等于页大小来表示）。

所有表的行结构相同。有个固定大小的头（在大多数机器占用23字节），随后一个可选的NULL位图项，对象ID字段和用户数据。该头的详细信息见表 58-4。实际的用户数据（行中的列）从t_hoff表示的偏移量开始，它必须始终是平台的MAXALIGN的倍数。仅在t_infomask设置了HEAP_HASNULL位时，NULL位图才存在。如果它存在，它就开始于固定头的后面，占用足够的字节，每数据列一位。（总共t_natts位）在这个位列表中，1位表示非空， 0 表示空。仅在t_infomask设置了HEAP_HASOID位时，对象ID 才存在。如果存在，它将出现在t_hoff边界前。任何使 t_hoff 为MAXALIGN倍数的填充将出现在NULL位图和对象ID之间。（反过来又保证对象ID得到恰当的对齐）

表 58-4. HeapTupleHeaderData布局

字段	类型	长度	描述
t_xmin	TransactionId	4字节	插入XID戳
t_xmax	TransactionId	4字节	删除XID戳
t_cid	CommandId	4字节	插入和/或删除 CID戳(使用t_xvac覆盖)
t_xvac	TransactionId	4字节	VACUUM操作移动一行版本的XID
t_ctid	ItemPointerData	6字节	这个当前的或新行版本的TID
t_infomask2	uint16	2字节	字段个数，以及各种标志位
t_infomask	uint16	2字节	各种标志位
t_hoff	uint8	1字节	用户数据偏移量

在src/include/access/htup.h可以找到所有的详细信息。

对实际数据的解析只能通过从其它表获取信息来做，大多来自于pg_attribute，表示字段位置的键值是attlen和attalign。没有直接获取特定字属性的方法，除非只有固定宽度的字段并且没有空值。所有这些策略被封装在函数heap_getattr、fastgetattr 和heap_getsysattr中。

要读取数据你需要逐次检查每个属性。首先依据NULL位图检查字段是否为NULL，如果是，跳到下一个，然后确定你已经右对齐；如果字段是固定宽度的，那么所有的字节被简单地放置，如果它是变长的字段（attlen = -1）那么它是一个更复杂的位。所有变长数据类型共享通用的头结构struct varlena，其包括存储值的总长度和一些标志位。依赖这些标志，可以判断数据是行内或在一个TOAST表，也可能是压缩的。（参阅第 58.2 节）

上一页	起始页	下一页
初始化分支	上一级	BKI后端接口

58.6. 数据库页布局

备注