物理备份与恢复
物理备份
可获得性
本特性自openGauss 1.0.0 版本开始引入。
特性简介
支持将整个数据库的数据以内部格式备份到指定的存储介质中。
客户价值
通过物理备份特性,可以达成以下目的:
- 整个数据库的数据备份到可靠性更高的存储介质中,提升系统整体的可靠性。
- 通过采用数据库内部的数据格式,极大提升备份恢复性能。
- 可以用于冷数据的归档。
典型的物理备份策略和应用场景如下:
- 周一,执行数据库全量备份
- 周二,以周一全量备份为基准点,执行增量备份
- 周三,以周二增量备份为基准点,执行增量备份
- …
- 周日,以周六增量备份为基准点,执行增量备份
上述备份策略以一个星期为周期。
特性描述
openGauss提供物理备份能力,可以将整个数据库的数据以数据库内部格式备份到本地磁盘文件、OBS对象、NBU对象或爱数对象中,并在同构数据库中恢复整个数据库的数据。在基础之上,还提供压缩、流控、断点续备等高阶功能。
物理备份主要分为全量备份和增量备份,区别如下:全量备份包含备份时刻点上数据库的全量数据,耗时时间长(和数据库数据总量成正比),自身即可恢复出完整的数据库;增量备份只包含从指定时刻点之后的增量修改数据,耗时时间短(和增量数据成正比,和数据总量无关),但是必须要和全量备份数据一起才能恢复出完整的数据库。
特性增强
支持全量备份和增量备份同时执行。
以下特性自openGauss 6.0.0开始支持:
支持gs_probackup工具备份数据时将备份的数据和日志直接传输到远端兼容S3协议的对象存储中。
说明:
如果在开启归档的集群环境中进行物理备份操作,需注意归档是否成功执行完成,若归档因为一些原因而停止,会导致备份操作失败。使归档停止的原因可能有如下几种:
- 归档参数配置错误。
- 归档磁盘空间不足。
- 归档目录无权限。
上述几种情况会导致归档停止和备份失败,同时能在 archive_status 目录下发现有 XLOG.ready 文件存在。
gs_backup方式
具体使用操作步骤参考gs_backup。
gs_basebackup方式
具体使用操作步骤参考gs_basebackup。
gs_probackup方式
具体使用操作步骤参考gs_probackup。
PITR恢复
背景信息
当数据库崩溃或希望回退到数据库之前的某一状态时,openGauss的即时恢复功能(Point-In-Time Recovery,简称PITR)可以支持恢复到备份归档数据之后的任意时间点。
说明:
- PITR仅支持恢复到物理备份数据之后的某一时间点。
- 仅主节点可以进行PITR恢复,备机需要进行全量build达成与主机数据同步。
- 恢复前建议对已归档的XLOG进行备份。因为若恢复后不满意当前的恢复状态,想重新进行恢复,但此时已归档的XLOG可能会被新归档的XLOG所覆盖,从而可能导致恢复失败。
前提条件
- 基于经过物理备份的全量数据文件。
- 基于已归档的WAL日志文件。
PITR恢复流程
- 将物理备份的文件替换目标数据库目录。
- 删除数据库目录下pg_xlog/中的所有文件。
- 将归档的WAL日志文件复制到pg_xlog文件中(此步骤可以省略,通过配置recovery.conf恢复命令文件中的restore_command项替代)。
- 在数据库目录下创建恢复命令文件recovery.conf,指定数据库恢复的程度。
- 启动数据库。
- 连接数据库,查看是否恢复到希望预期的状态。
- 若已经恢复到预期状态,通过pg_xlog_replay_resume()指令使主节点对外提供服务。
recovery.conf文件配置
归档恢复配置
- restore_command = string
这个SHELL命令是获取WAL文件系列中已归档的WAL文件。字符串中的任何一个%f是用归档检索中的文件名替换,并且%p是用服务器上的复制目的地的路径名替换。任意一个%r是用包含最新可用重启点的文件名替换。
示例:
restore_command = 'cp /mnt/server/archivedir/%f %p'
- archive_cleanup_command = string
这个选项参数声明一个shell命令。在每次重启时会执行这个shell命令。 archive_cleanup_command为清理备库不需要的归档WAL文件提供一个机制。 任何一个%r由包含最新可用重启点的文件名代替。这是最早的文件,因此必须保留以允许恢复能够重新启动,因此所有早于%r的文件可以安全的移除。
示例:
archive_cleanup_command = 'pg_archivecleanup /mnt/server/archivedir %r'
需要注意的是,如果多个备服务器从相同的归档路径恢复时, 需要确保在任何一个备服务器在需要之前,不能删除WAL文件。
- recovery_end_command = string
这个参数是可选的,用于声明一个只在恢复完成时执行的SHELL命令。recovery_end_command是为以后的复制或恢复提供一个清理机制。
恢复目标设置
- recovery_target_name = string
此参数声明命名还原到一个使用pg_create_restore_point()创建的还原点。
示例:
recovery_target_name = 'restore_point_1'
- recovery_target_time = timestamp
此参数声明命名还原到一个指定时间戳。
示例:
recovery_target_time = '2020-01-01 12:00:00'
- recovery_target_xid = string
这个参数声明还原到一个事务ID。
示例:
recovery_target_xid = '3000'
- recovery_target_lsn = string
这个参数声明还原到日志的指定LSN点。
示例:
recovery_target_lsn = '0/0FFFFFF'
- recovery_target_inclusive = boolean
声明是否在指定恢复目标(true)之后停止,或在这(false)之前停止。该声明仅支持恢复目标为recovery_target_time、recovery_target_xid和recovery_target_lsn的配置。
示例:
recovery_target_inclusive = true
说明:
recovery_target_name、recovery_target_time、recovery_target_xid、recovery_target_lsn这四个配置项仅同时支持一项。
如果不配置任何恢复目标,或配置目标不存在,则默认恢复到最新的WAL日志点。