PostgreSQL pg_archivecleanup与清理archivelog的操作_PostgreSQL

PostgreSQL pg_archivecleanup与清理archivelog的操作

2021-03-17 21:10Austindatabases PostgreSQL

这篇文章主要介绍了PostgreSQL pg_archivecleanup与清理archivelog的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

pg_archivecleanup 和 pg_rewind 是pg 中两个重要的功能，一个是为了清理过期的 archive log 使用的命令，另一个是你可以理解为物理级别的 wal log的搬运工。

我们先说第一个 pg_archivecleanup 命令，这个命令主要是用于使用了archive log 功能的 postgresql 但在 archive log 堆积如山的情况下，你怎么来根据某些规则，清理这些日志呢？

这里面就要使用 pg_archivecleanup 这个命令了，可以定时的来运行它，将已经移动到archivecleanup 的目录的archivelog 根据要求开始清理。

当然我们先的说说如果不定期清理会出什么问题

1 如果不定期清理archive 如果存放archivelog 的位置无法在接受新的日志，则大量wal日志会滞留在 wal_log 目录中，则整体数据库系统都会受到影响。

2 占用大量的存储空间，存储无效的数据

那一般来说如果没有第三方的备份工具的情况下，怎么来通过pg_archivecleanup 来进行archivelog 的清理。

需要关注几个点

1 清理的时，清理的wal_log 是否已经是包含在最后一次的备份中，保证清理的wal_log 也可以从备份文件中恢复数据库

2 清理的时候，对于保存在非主库的wal_log 怎么办

一般来说，设置自动清理archive_log 可以在配置文件中添加

1	`archive_cleanup_command =` `'pg_archivecleanup archivelocation %r'`

来操作。

但一般来说这样做好处少，弊病多，我比较喜欢写相关的脚本，定时去运行的方式，并且可以记录相关的log 日志等等。

PostgreSQL pg_archivecleanup与清理archivelog的操作

可以写一个脚本，来辅助定时清理相关的archive_log

PostgreSQL pg_archivecleanup与清理archivelog的操作

当然这样的方法也是有弊端的，如果由于备份的原因的故障，而直接使用天数来清理会有因为没有备份而直接将 wal_log 给清理掉，所以更加靠谱的方法是通过某些命令来获得需要截止的清理的wal_log 名称。

例如备份后的

PostgreSQL pg_archivecleanup与清理archivelog的操作

会在wal_log 里面有backup 的标记，这说明这个wal log 以前的数据已经备份了，如果清理这个wal log 之前的log 是安全的。

1	`000000010000000300000030.00000060.backup`

使用下面的脚本可以来更安全的清理

									#!/bin/bash 

									archivedir='/pgdata/archive'

									chk_safe=$(find $archivedir -type f -mtime +3 -name '*backup' -printf '%f\n' | sort -r | head -1)

									cd $archivedir

									/usr/local/postgres/bin/pg_archivecleanup $archivedir $chk_safe 

									find $archivedir -type f -mtime +3 -a -name '*backup' -a ! -newer $chkpoint -delete

补充：postgresql流日志误删处理（xlog）

今天同事误删postgresql库数据文件下的pg_xlog文件夹，导致所有流日志丢失，数据库无法启动,观察警告日志：

									2018-03-12 18:45:54 cst log: database system shutdown was interrupted; last known up at 2018-03-12 17:48:27 cst

									2018-03-12 18:45:54 cst log: could not open file "pg_xlog/000000010000001400000060" (log file 20, segment 96): no such file or directory

									2018-03-12 18:45:54 cst log: invalid primary checkpoint record

									2018-03-12 18:45:54 cst log: could not open file "pg_xlog/000000010000001400000060" (log file 20, segment 96): no such file or directory

									2018-03-12 18:45:54 cst log: invalid secondary checkpoint record

									2018-03-12 18:45:54 cst panic: could not locate a valid checkpoint record

									2018-03-12 18:45:54 cst log: startup process (pid 32680) was terminated by signal 6: aborted

									2018-03-12 18:45:54 cst log: aborting startup due to startup process failure