<div dir="auto">Hello,<div dir="auto"><br style=""><span style="font-family:sans-serif;font-size:12.8px">We have setup active-passive cluster using streaming replication on Rhel7.5. We are testing pacemaker for automated failover.</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">We are seeing below issues with the setup :</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">1. When a failover is triggered when data is being added to the primary by killing primary (killall -9 postgres), the standby doesnt come up in sync.</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">On pacemaker, the crm_mon -Afr shows standby in disconnected and HS:alone state.</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">On postgres, we see below error:</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.266 IST > LOG:  entering standby mode</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.267 IST > LOG:  database system was not properly shut down; automatic recovery in progress</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.270 IST > LOG:  redo starts at 1/680A2188</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.370 IST > LOG:  consistent recovery state reached at 1/6879D9F8</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.370 IST > LOG:  database system is ready to accept read only connections</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">cp: cannot stat '/var/lib/pgsql/9.6/data/</span><span style="font-family:sans-serif;font-size:12.8px">archivedir/</span><span style="font-family:sans-serif;font-size:12.8px">000000010000000100000068': No such file or directory</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.751 IST > LOG:  statement: select pg_is_in_recovery()</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:46.782 IST > LOG:  statement: show synchronous_standby_names</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:50.993 IST > LOG:  statement: select pg_is_in_recovery()</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:53.395 IST > LOG:  started streaming WAL from primary at 1/68000000 on timeline 1</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:53.436 IST > LOG:  invalid contrecord length 2662 at 1/6879D9F8</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">< 2019-09-20 17:07:53.438 IST > FATAL:  terminating walreceiver process due to administrator command</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">cp: cannot stat '/var/lib/pgsql/9.6/data/</span><span style="font-family:sans-serif;font-size:12.8px">archivedir/00000002.history': No such file or directory</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">cp: cannot stat '/var/lib/pgsql/9.6/data/</span><span style="font-family:sans-serif;font-size:12.8px">archivedir/</span><span style="font-family:sans-serif;font-size:12.8px">000000010000000100000068': No such file or directory</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">When we try to restart postgres on the standby, using pg_ctl restart, the standby start syncing.</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">2. After standby syncs using pg_ctl restart as mentioned above, we found out that 1-2 records are missing on the standby.</span><br style="font-family:sans-serif;font-size:12.8px"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">Need help to check:</span><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">1. why the standby starts in disconnect, HS:alone state? </span></div><div dir="auto"><span style="font-family:sans-serif;font-size:12.8px"><br></span></div><div dir="auto"><span style="font-family:sans-serif;font-size:12.8px">f you have faced this issue/have knowledge, please let us know.</span></div><div dir="auto"><br style="font-family:sans-serif;font-size:12.8px"><span style="font-family:sans-serif;font-size:12.8px">Thanks.</span></div></div>