<div dir="ltr"><div class="gmail_quote"><div dir="ltr"><div dir="ltr">Hi, Thank you all for responding so quickly. Part of corosync.log file is attached. Cluster failure occured in 09:16  AM yesterday.</div><div>Debug mode is turned on in corosync configuration, but I didn't turn it on in pacemaker config. I will test that. Postgres log is also attached.</div><div>Several times cluster failed because of ldap time out, even if I tried to disable ldap searching for local postgres user, then it also failed after pacemaker automatic update, so several packages are on hold now. But I cannot figure what caused failure now.</div><div>From syslog it looks like postgres systemd process was stoped, postgres_exporter is just scirpt for monitoring postgres replication.</div><div><br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, 9 Jul 2019 19:57:06 +0300<br></div>
Andrei Borzenkov <<a href="mailto:arvidjaar@gmail.com" target="_blank">arvidjaar@gmail.com</a>> wrote:<br>
<br>
> 09.07.2019 13:08, Danka Ivanović пишет:<br>
> > Hi I didn't manage to start master with postgres, even if I increased start<br>
> > timeout. I checked executable paths and start options.<br>
<br>
We would require much more logs from this failure...<br>
<br>
> > When cluster is running with manually started master and slave started over<br>
> > pacemaker, everything works ok.<br>
<br>
Logs from this scenario might be interesting as well to check and compare.<br>
<br>
> > Today we had failover again.<br>
> > I cannot find reason from the logs, can you help me with debugging? Thanks.<br>
<br>
logs logs logs please.<br>
<br>
> > Jul 09 09:16:32 [2679] postgres1       lrmd:    debug:<br>
> > child_kill_helper:  Kill pid 12735's group Jul 09 09:16:34 [2679]<br>
> > postgres1       lrmd:  warning: child_timeout_callback:<br>
> > PGSQL_monitor_15000 process (PID 12735) timed out  <br>
> <br>
> You probably want to enable debug output in resource agent. As far as I<br>
> can tell, this requires HA_debug=1 in environment of resource agent, but<br>
> for the life of me I cannot find where it is possible to set it.<br>
> <br>
> Probably setting it directly in resource agent for debugging is the most<br>
> simple way.<br>
<br>
I usually set this in "/etc/sysconfig/pacemaker". Never tried to add it<br>
to pgsqlms, interesting.<br>
<br>
> P.S. crm_resource is called by resource agent (pgsqlms). And it shows<br>
> result of original resource probing which makes it confusing. At least<br>
> it explains where these logs entries come from.<br>
<br>
Not sure tu understand what you mean :/</div></div></blockquote></div></div></div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"></div></div></div></div></div></div></div>