示例:逻辑复制代码示例
下面示例演示如何通过JDBC接口使用逻辑复制功能的过程。
针对逻辑复制的配置选项,除了在逻辑解码中的配置选项外,还有专门给JDBC等流式解码工具增加的配置项,如下所示:
解码线程并行度
通过配置选项parallel-decode-num,指定并行解码的Decoder线程数量。其取值范围为1~20的int型,取1表示按照原有的串行逻辑进行解码,取其余值即为开启并行解码。默认值为1。当该选项配置为1时,禁止配置以下选项:解码格式选项decode-style、批量发送选项sending-batch和并行解码队列长度选项parallel-queue-size。
解码格式
通过配置选项decode-style,指定解码格式。其取值为char型的字符'j'、't'或'b',分别代表json格式、text格式及二进制格式。默认值为'b'即二进制格式解码。该选项仅允许并行解码时设置,且二进制格式解码仅在并行解码场景下支持。与二进制格式对应的json和text格式,在批量发送的解码结果中,每条解码语句的前4字节组成的uint32代表该条语句总字节数(不包含该uint32类型占用的4字节,0代表本批次解码结束),8字节uint64代表相应lsn(begin对应first_lsn,commit对应end_lsn,其他场景对应该条语句的lsn)。
说明:
二进制格式编码规则如下所示:
- 前4字节代表接下来到语句级别分隔符字母P(不含)或者该批次结束符F(不含)的解码结果的总字节数,该值如果为0代表本批次解码结束。
- 接下来8字节uint64代表相应lsn(begin对应first_lsn,commit对应end_lsn,其他场景对应该条语句的lsn)。
- 接下来1字节的字母有5种B/C/I/U/D,分别代表begin/commit/insert/update/delete。
- 第3.接下来1字节的字母有5种B/C/I/U/D,…步字母为B时:
- 接下来的8字节uint64代表CSN。
- 接下来的8字节uint64代表first_lsn。
- 【该部分为可选项】接下来的1字节字母如果为T,则代表后面4字节uint32表示该事务commit时间戳长度,再后面等同于该长度的字符为时间戳字符串。
- 因为之后仍可能有解码语句,接下来会有1字节字母P或F作为语句间的分隔符,P代表本批次仍有解码的语句,F代表本批次完成。
- 第3.接下来1字节的字母有5种B/C/I/U/D,…步字母为C时:
- 【该部分为可选项】接下来1字节字母如果为X,则代表后面的8字节uint64表示xid。
- 【该部分为可选项】接下来的1字节字母如果为T,则代表后面4字节uint32表示时间戳长度,再后面等同于该长度的字符为时间戳字符串。
- 因为批量发送日志时,一个COMMIT日志解码之后可能仍有其他事务的解码结果,接下来的1字节字母如果为P则表示该批次仍需解码,如果为F则表示该批次解码结束。
- 第3.接下来1字节的字母有5种B/C/I/U/D,…步字母为I/U/D时:
- 接下来的2字节uint16代表schema名的长度。
- 按照上述长度读取schema名。
- 接下来的2字节uint16代表table名的长度。
- 按照上述长度读取table名。
- 【该部分为可选项】接下来1字符字母如果为N代表为新元组,如果为O代表为旧元组,这里先发送新元组。
- 接下来的2字节uint16代表该元组需要解码的列数,记为attrnum。
- 以下流程重复attrnum次。
- 接下来2字节uint16代表列名的长度。
- 按照上述长度读取列名。
- 接下来4字节uint32代表当前列类型的Oid。
- 接下来4字节uint32代表当前列的值(以字符串格式存储)的长度,如果为0xFFFFFFFF则表示NULL,如果为0则表示长度为0的字符串。
- 按照上述长度读取列值。
- 因为之后仍可能有解码语句,接下来的1字节字母如果为P则表示该批次仍需解码,如果为F则表示该批次解码结束。
限制仅备机解码
通过配置选项standby-connection,指定是否限制仅备机解码。其取值为bool型(可用0或1表示),取true(或1)代表限制仅允许连接备机解码,连接主机解码时会报错退出;取false(或0)时不做限制。默认值为false(0)。
批量发送
通过配置选项sending-batch,指定是否批量发送。其取值范围为0或1的int型,取0表示逐条发送解码结果,取1表示解码结果累积到达1MB则批量发送解码结果。默认值为0。该选项仅允许并行解码时设置。开启批量发送的场景中,当解码格式为'j'或't'时,在原来的每条解码语句之前会附加一个uint32类型,表示本条解码结果长度(长度不包含当前的uint32类型),以及一个uint64类型,表示当前解码结果对应的lsn。
并行解码队列长度
通过配置选项parallel-queue-size,指定并行逻辑解码线程间进行交互的队列长度。取值范围【2,1024】,且必须为2的幂数,默认值为128。队列长度和解码过程的内存使用量正相关。
逻辑解码内存阈值
通过配置选项max-txn-in-memory指定单个事务解码中间结果缓存的内存阈值;单位为MB,范围【0,100】,默认值为0,表示不管控内存使用。通过配置选项max-reorderbuffer-in-memory指定所有事务解码中间结果缓存的内存阈值;单位为GB,范围【0,100】,默认值为0,表示不管控内存使用。当超过内存阈值时,解码过程将出现解码中间结果写临时文件的现象,影响逻辑解码的性能。
逻辑解码发送超时阈值
通过配置选项sender-timeout指定内核与客户端的心跳超时阈值。当该时间段内没有收到客户端任何消息,逻辑解码将主动停止,并断开和客户端的连接。单位为毫秒(ms),范围【0, 2147483647】,默认值取决于GUC参数logical_sender_timeout配置。
JDBC默认设置逻辑解码连接的socketTimeout=10s,备机解码在主机压力大的时候可能会导致连接超时关闭,可以通过配置withStatusInterval(10000,TimeUnit.MILLISECONDS),调整超时时间解决。
在并行解码的标准场景下(16核CPU、内存128G、网络带宽 > 200MBps、表的列数为10~100、单行数据量0.1KB~1KB、DML操作以insert为主、不涉及落盘事务即单个事务中语句数量小于4096、parallel-decode-num为8、解码格式为'b'且开启批量发送功能),解码性能(这里以xlog消耗量为标准)不低于100MBps。为保证解码性能达标以及尽量降低对业务的影响,一台备机上应尽量仅建立一个并行解码连接,保证CPU、内存、带宽资源充足。
注意:逻辑复制类PGReplicationStream为非线程安全类,并发调用可能导致数据异常。
//逻辑复制功能示例:文件名,LogicalReplicationDemo.java
//前提条件:添加JDBC用户机器IP到数据库白名单里,在pg_hba.conf添加以下内容即可:
//假设JDBC用户IP为10.10.10.10
//host all all 10.10.10.10/32 sha256
//host replication all 10.10.10.10/32 sha256
import org.postgresql.PGProperty;
import org.postgresql.jdbc.PgConnection;
import org.postgresql.replication.LogSequenceNumber;
import org.postgresql.replication.PGReplicationStream;
import java.nio.ByteBuffer;
import java.sql.DriverManager;
import java.util.Properties;
import java.util.concurrent.TimeUnit;
public class LogicalReplicationDemo {
private static PgConnection conn = null;
public static void main(String[] args) {
String driver = "org.postgresql.Driver";
//此处配置数据库IP以及端口,这里的端口为haPort,通常默认是所连接DN的port+1端口
String sourceURL = "jdbc:postgresql://$ip:$port/postgres";
//默认逻辑复制槽的名称是:replication_slot
//测试模式:创建逻辑复制槽
int TEST_MODE_CREATE_SLOT = 1;
//测试模式:开启逻辑复制(前提条件是逻辑复制槽已经存在)
int TEST_MODE_START_REPL = 2;
//测试模式:删除逻辑复制槽
int TEST_MODE_DROP_SLOT = 3;
//开启不同的测试模式
int testMode = TEST_MODE_START_REPL;
try {
Class.forName(driver);
} catch (Exception e) {
e.printStackTrace();
return;
}
try {
Properties properties = new Properties();
PGProperty.USER.set(properties, "user");
PGProperty.PASSWORD.set(properties, "passwd");
//对于逻辑复制,以下三个属性是必须配置项
PGProperty.ASSUME_MIN_SERVER_VERSION.set(properties, "9.4");
PGProperty.REPLICATION.set(properties, "database");
PGProperty.PREFER_QUERY_MODE.set(properties, "simple");
conn = (PgConnection) DriverManager.getConnection(sourceURL, properties);
System.out.println("connection success!");
if(testMode == TEST_MODE_CREATE_SLOT){
conn.getReplicationAPI()
.createReplicationSlot()
.logical()
.withSlotName("replication_slot") //这里字符串如包含大写字母则会自动转化为小写字母
.withOutputPlugin("mppdb_decoding")
.make();
}else if(testMode == TEST_MODE_START_REPL) {
//开启此模式前需要创建复制槽
LogSequenceNumber waitLSN = LogSequenceNumber.valueOf("6F/E3C53568");
PGReplicationStream stream = conn
.getReplicationAPI()
.replicationStream()
.logical()
.withSlotName("replication_slot")
.withSlotOption("include-xids", false)
.withSlotOption("skip-empty-xacts", true)
.withStartPosition(waitLSN)
.withSlotOption("parallel-decode-num", 10) //解码线程并行度
.withSlotOption("white-table-list", "public.t1,public.t2") //白名单列表
.withSlotOption("standby-connection", true) //强制备机解码
.withSlotOption("decode-style", "t") //解码格式
.withSlotOption("sending-batch", 1) //批量发送解码结果
.withSlotOption("max-txn-in-memory", 100) //单个解码事务落盘内存阈值为100MB
.withSlotOption("max-reorderbuffer-in-memory", 50) //正在处理的解码事务落盘内存阈值为50GB
.start();
while (true) {
ByteBuffer byteBuffer = stream.readPending();
if (byteBuffer == null) {
TimeUnit.MILLISECONDS.sleep(10L);
continue;
}
int offset = byteBuffer.arrayOffset();
byte[] source = byteBuffer.array();
int length = source.length - offset;
System.out.println(new String(source, offset, length));
//如果需要flush lsn,根据业务实际情况调用以下接口
//LogSequenceNumber lastRecv = stream.getLastReceiveLSN();
//stream.setFlushedLSN(lastRecv);
//stream.forceUpdateStatus();
}
}else if(testMode == TEST_MODE_DROP_SLOT){
conn.getReplicationAPI()
.dropReplicationSlot("replication_slot");
}
} catch (Exception e) {
e.printStackTrace();
return;
}
}
}