PostgreSQL中的Toast Pointer
1、分析背景
在使用数据库的过程中(PG的版本为9.2),遇到了错误"missing chunk number 0 for toast value XX in pg_toast_2619"。根据错误描述,猜测原因可能是:主表字段还留存着Toast Pointer,但Toast表中已经没有对应的Chunk条目。证明这个猜测的关键,是根据主表字段的Toast Pointer,去找Toast Pointer所指向的Chunk条目是否存在。自然,读懂(解析)Toast Pointer就是分析的第一步,但我查阅了大量资料后却没有找到直接解析Toast Pointer的方法,只好自己尝试去分析。本文就是要探索Toast Pointer解析的方法,并对Toast Pointer的结构进行说明。
在分析之前,先说明主表与Toast表的组织关系,如下图:
2、分析方法
分析思想:通过对数据内容的分析,反向推演数据的结构。
分析方法:制造数据得到一个真实的Toast Pointer,通过对Toast Pointer二进制表达的分析,确定Toast Pointer由哪几部分组成以及各部分的含义,并加以证明。
3、分析过程
基于上述分析方法,分析过程如下:
1)安装pageinspect扩展
借助该扩展,可查看page中各结构体的数值,以及tuple(行)的Raw值(得到Toast Pointer必须查看RAW值,因为通过SQL来查询B字段,将得到Toast Pointer所指向的value,而不是B字段存储的Toast Pointer)。
2)制作测试数据
创建了测试表t,向表t的col字段插入了长度为3808的字符串。col字段的存储类型为"extended",说明会首先压缩,如果压缩后仍然超过TOAST_TUPLE_THRESHOLD(一般为2K),将使用Toast表。
3)检查Toast是否启用
表t对应的Toast表OID为27132,表名为pg_toast_27129。
pg_toast_27129的大小不为0,说明在该例中启用了Toast表。
4)检查col字段是否启用了压缩
col字段的字符个数为3808,但存储仅占用了2763字节,说明col字段启用了压缩。该现象与col字段的存储类型"extend"一致。
5)查看pg_toast_27129表中的chunk条目
col字段中的字符串被分成2个chunk,即在Toast表中有2个chunk条目。2个chunk条目长度合计值为2763,与上一步压缩后的存储字节数一致。
6)得到col字段的RAW值
使用pageinspect扩展的get_raw_page、heap_page_items函数,得到表t唯一一条记录的row value(即t_data)值,该row value也是唯一的一个字段col在内存中的二进制表达。
在pg的官方文档中,对Toast有这样的一段描述:
从上文选中部分可知,Toast Pointer的大小为18字节,包括变长标头、字段值实际长度、字段值逻辑长度、Toast表OID、Toast Chunk OID 共5个部分。OID一般占用4字节,我们从t_data的最右边分析起,先取4个字节0xfc690000。由于X86架构下,使用小端存储,因此内存中的0xfc690000,实际的字节序为0x000069fc,将其转换为10进制数值
而27132,正是Toast表的OID:
因此,最右边4个字节代表Toast表的OID。
继续取下一个4字节0xff690000,转换为10进制数值:
而27135,正是Chunk的OID:
因此靠右的5-8字节代表Chunk的OID。
继续取下一个4字节0xcb0a0000,转换为10进制数值:
而2763,正是col字段的逻辑长度(压缩后的长度):
因此靠右的9-12字节代表字段值的逻辑长度。
继续取下一个4字节0xe40e0000,转换为10进制数值:
而3812,正是col字段实际长度3808+4(表示实际长度所占用的4字节):
因此靠右的13-16字节代表字段值的实际长度(包括表示长度的4字节自身)。
至于最后的2字节0x0112,以不同的值插入时,这两个字节的内容是不变的。暂时没有分析清楚这两个字节所代表的含义。
4、分析结论
综上分析,Toast Pointer的大小由18字节、5部分组成,分别是:
字节流(从左往右) |
含义 |
1-2 |
不详 |
3-6 |
字段值的实际长度 |
7-10 |
字段值的逻辑长度 |
11-14 |
Chunk号,即Chunk_id |
15-16 |
Toast表的OID |
如果遇到了"missing chunk number 0 for toast value XX in pg_toast_2619 "错误,可通过如下方法进行验证:
1)通过上文的方法得到某行某列值的Toast Pointer
2)再从Toast Pointer中解析得到Toast表的OID(这个从pg_class中也可以得到)、Chunk号,
3)去Toast表中查询是否存在该Chunk_id对应的条目。
PostgreSQL中的Toast Pointer的更多相关文章
- 通过arcgis在PostgreSQL中创建企业级地理数据库
部署环境: Win7 64位旗舰版 软件版本: PostgreSQL-9.1.3-2-windows-x64 Postgis-pg91x64-setup-2.0.6-1 Arcgis 10.1 SP1 ...
- css鼠标手型cursor中hand与pointer
css鼠标手型cursor中hand与pointer Example:CSS鼠标手型效果 <a href="#" style="cursor:hand"& ...
- Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构
分享两篇Win 10应用开发的XML文档结构:Win 10 开发中Adaptive磁贴模板的XML文档结构,Win10 应用开发中自适应Toast通知的XML文档结构. Win 10 开发中Adapt ...
- 如何在子线程中使用Toast和更新UI
因为没一个Looper处理消息循环,所以子线程中无法使用Toast 方法: Looper.prepare(); Toast.makeText(getActivity(),"刷到底啦" ...
- Android学习笔记----TimerTask中显示Toast的问题
今天想在TimerTask的run函数中调用Toast显示一下提示信息,却总是导致程序崩溃.可是try语句块却又无法捕获到异常,代码如下: ...... Timer timer = new Timer ...
- PostgreSQL 中日期类型转换与变量使用及相关问题
PostgreSQL中日期类型与字符串类型的转换方法 示例如下: postgres=# select current_date; date ------------ 2015-08-31 (1 row ...
- PostgreSQL 中定义自己需要的数据类型
PostgreSQL解决某系数据库中的tinyint数据类型问题,创建自己需要的数据类型如下: CREATE DOMAIN tinyint AS smallint CONSTRAINT tinyint ...
- 在PostgreSQL中使用oracle_fdw访问Oracle
本文讲述如何在PostgreSQL中使用oracle_fdw访问Oracle上的数据. 1. 安装oracle_fdw 可以参照:oracle_fdw in github 编译安装oracle_fdw ...
- [原创]PostgreSQL中十进制、二进制、十六进制之间的相互转换
在PostgreSQL中,二进制.十进制.十六进制之间的转换是非常方便的,如下: 十进制转十六进制和二进制 mydb=# SELECT to_hex(10); to_hex -------- a (1 ...
随机推荐
- 02 .NET CORE 2.2 使用OCELOT -- 路由
继续学习.NET CORE 2.2 使用OCELOT https://www.jianshu.com/p/05ccf87a3091 https://www.jianshu.com/p/585396dc ...
- 基于roslyn的动态编译库Natasha
人老了,玩不转博客园的编辑器,详细信息转到:https://mp.weixin.qq.com/s/1r6YKBkyovQSMUgfm_VxBg 关键字:Github, NCC, Natasha,Ros ...
- 解决plsql中文显示问号(???)问题
最近新买的电脑,配置好数据库连接后,plsql查看数据与插入中文数据都显示问号(???),同事的都正常显示,查看了很多资料,有的说是数据库字符集的原因让修改数据库的字符集,但是我的数据库都是远程连接正 ...
- Delphi - 采用第三方控件TMS、SPComm开发串口调试助手
第三方控件TMS.SPComm的下载与安装 盒子上可搜索关键字进行下载,TMS是.dpk文件,SPComm.pas文件: 安装方法自行百度,不做赘述. 通过TMS控件进行界面布局 界面预览: Delp ...
- Windows怎么安装配置Elasticsearch
进入Elasticsearch官网,点击Download,Elasticsearch默认端口9200 然后进入下图:有各种版本,我选择windows版本 下载之后,解压得到Elasticsearch文 ...
- [快捷键的使用] IntelliJ IDEA 将数据库里面的表转化为对象
本文讲述IntelliJ IDEA 多行编辑快捷键的使用,希望能帮到新人提高效率. 注意:在笔记本键盘上操作的方法. 数据库连接工具使用SQLyog 第一步: 从数据里面将文本拷贝到User类里面. ...
- 【转】面试题:实现一个队列,这个队列除了有EnQueue, DeQueue操作,还有一个Max操作,三个操作复杂度都是O(1)
1.每次 新元素进栈的时候,栈里面的元素需要排序 2.让最小的或者最大的元素位于栈顶,这样就可以在O(1)时间内获得最小或者最大的值了, ------ 3.上面的想法 不能保证,进栈(进了队列)之 ...
- JavaWeb Listener之HttpSessionBindListener
HttpSessionBindListener 监听把自身这个对象绑定到HttpSession对象上.解绑 绑定到HttpSession对象上,其实就是调用session的setAttr ...
- 生成Uuid工具类
package com.freeter.util; import java.util.UUID; /** * @author liuqi * **/public class Uuid{ public ...
- day 69作业
""" 1.按照上方 知识点总结 模块,总结今天所学知识点: 2.有以下广告数据(实际数据命名可以略做调整) ad_data = { tv: [ {img: 'img/t ...