<div dir="ltr">Hello,<div><br></div><div>I currently have Pacemaker v2.0.3-3ubuntu4.2 running on two Ubuntu 20.04 LTS systems. My config consists of two service groups, both of which have an LSB resource and a floating IP resource.   The LSB resource is configured with a monitor operation, so that "/etc/init.d/<lsb-resource-name> status" is ran in 30 second intervals. the "status portion of the script only returns a healthy exit code when it determines that the PID behind a PIDfile is active.  Additionally, I have also set an 'rsc_location' constraint so that the service group for VIP A prefers node A, and VIP B prefers node B, so that ideally with both nodes active and healthy, VIP A will always be running on node A, and B on node B.</div><div><br></div><div><br></div><div>The problem that I'm having is that if I intentionally shutdown the service that my "/etc/init.d/<lsb-resource-name> status" script is checking against, I get the following behavior:</div><div>- I shutdown backing service on node B.</div><div>- Pacemaker performs a status check which returns a bad result.</div><div>- Pacemaker then correctly migrates the VIP and the LSB resource for the now 'offline' service group from node B to node A</div><div>- Pacemaker 'failure-timeout' interval expires.</div><div>- Pacemaker shuts down the VIP B service group on node A.</div><div>- Pacemaker attempts to start the VIP B service group on node B, which fails.</div><div>- Pacemaker starts the VIP B service group on node A.</div><div><div><div>- Pacemaker 'failure-timeout' interval expires.</div><div></div></div><div><div>- Pacemaker shuts down the VIP B service group on node A.</div><div>- Pacemaker attempts to start the VIP B service group on node B, which fails.</div><div>- Pacemaker starts the VIP B service group on node A.</div><div>- .... and so on</div><div><br></div><div>What I would LIKE to happen is for pacemaker to attempt to run a "status" on node B, PRIOR to stopping the service group on node A and attempting to start the service group on node B.  Something like this behavior.</div><div><div><div>- Pacemaker 'failure-timeout' interval expires.</div><div></div></div><div><div>- Pacemaker checks the status of the LSB service (/etc/init.d/<lsb resource name> status) which returns a bad error code.</div><div>- Pacemaker 'failure-timeout' interval expires.</div></div></div><div><div>- Pacemaker checks the status of the LSB service (/etc/init.d/<lsb resource name> status) which returns a bad error code.</div><div><br></div><div>At which point an administrator or an automated script could intervene and bring the backing service online, at which point we would have this behavior:</div><div></div></div><div><div><div><div>- Pacemaker 'failure-timeout' interval expires.</div></div></div><div><div>- Pacemaker checks the status of the LSB service (/etc/init.d/<lsb resource name> status) which returns a HEALTHY error code.</div><div>- Pacemaker shuts down the VIP B service group on node A.</div><div>- Pacemaker starts the VIP B service group on node B.</div><div><br></div><div>I have attached an obfuscated pastebin of my current Pacemaker configuration, as well as a copy of the logs for the pacemaker service, when the initial failure occurs, and also capturing the repetitive failed attempts to start the LSB resource.</div><div><br></div><div></div></div></div><div><div><div></div></div></div></div><div>





<p class="gmail-p1" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue""><br></p><p class="gmail-p1" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue"">Obfuscated "crm configure show"</p>
<p class="gmail-p2" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue";color:rgb(220,161,13)"><a href="https://pastebin.com/emAw8juQ">https://pastebin.com/emAw8juQ</a></p>
<p class="gmail-p3" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue";min-height:15px"><br></p>
<p class="gmail-p1" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue"">Obfuscated "journalctl -fu pacemaker"</p>
<p class="gmail-p2" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue";color:rgb(220,161,13)"><a href="https://pastebin.com/kcnfCrjf">https://pastebin.com/kcnfCrjf</a></p>
<p class="gmail-p3" style="margin:0px;font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:13px;line-height:normal;font-family:"Helvetica Neue";min-height:15px"><br></p></div><div><br></div><div>Please let me know if there is a configuration parameter I can place in my config that would tell Pacemaker to perform a status check on the LSB resource PRIOR to attempting to start the service group on it's preferred node.</div><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr><td style="vertical-align:middle"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr><td><h3 color="#000000" style="margin:0px;font-size:16px;color:rgb(0,0,0)">Michael Romero</h3><p color="#000000" style="margin:0px;color:rgb(0,0,0);font-size:12px;line-height:20px">Lead Infrastructure Engineer</p><p color="#000000" style="margin:0px;color:rgb(0,0,0);font-size:12px;line-height:20px">Engineering | Convoso</p></td><td width="15"><div></div></td><td color="#6b3691" width="1" style="width:1px;border-bottom:none;border-left:1px solid rgb(107,54,145)"></td><td width="15"><div></div></td><td><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr height="25" style="vertical-align:middle"><td width="30" style="vertical-align:middle"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr><td style="vertical-align:bottom"><span color="#6b3691" width="11" style="display:block;background-color:rgb(107,54,145)"><img src="https://cdn2.hubspot.net/hubfs/53/tools/email-signature-generator/icons/phone-icon-2x.png" color="#6b3691" width="13" style="display:block"></span></td></tr></tbody></table></td><td style="padding:0px;color:rgb(0,0,0)"><a href="tel:562-338-9868" color="#000000" style="color:rgb(0,0,0);font-size:12px" target="_blank">562-338-9868</a></td></tr><tr height="25" style="vertical-align:middle"><td width="30" style="vertical-align:middle"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr><td style="vertical-align:bottom"><span color="#6b3691" width="11" style="display:block;background-color:rgb(107,54,145)"><img src="https://cdn2.hubspot.net/hubfs/53/tools/email-signature-generator/icons/email-icon-2x.png" color="#6b3691" width="13" style="display:block"></span></td></tr></tbody></table></td><td style="padding:0px"><a href="mailto:mromero@convoso.com" color="#000000" style="color:rgb(0,0,0);font-size:12px" target="_blank">mromero@convoso.com</a></td></tr><tr height="25" style="vertical-align:middle"><td width="30" style="vertical-align:middle"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS""><tbody><tr><td style="vertical-align:bottom"><span color="#6b3691" width="11" style="display:block;background-color:rgb(107,54,145)"><img src="https://cdn2.hubspot.net/hubfs/53/tools/email-signature-generator/icons/link-icon-2x.png" color="#6b3691" width="13" style="display:block"></span></td></tr></tbody></table></td><td style="padding:0px"><a href="https://www.convoso.com/" color="#000000" style="color:rgb(0,0,0);font-size:12px" target="_blank">www.convoso.com</a></td></tr></tbody></table></td></tr></tbody></table></td></tr><tr><td height="30"></td></tr><tr><td color="#6b3691" height="1" style="width:345px;border-bottom:1px solid rgb(107,54,145);border-left:none;display:block"></td></tr><tr><td height="30"></td></tr><tr><td><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS";width:345px"><tbody><tr><td style="vertical-align:top"><img src="https://www.convoso.com/wp-content/uploads/2017/04/logo.png" width="130" style="max-width:130px;display:block"></td><td style="text-align:right;vertical-align:top"><table cellpadding="0" cellspacing="0" style="vertical-align:-webkit-baseline-middle;font-family:"Trebuchet MS";display:inline-block"><tbody><tr><td style="color:rgb(255,255,255);font-family:"Trebuchet MS""><a href="https://linkedin.com/in/romerom" color="#6A78D1" style="display:inline-block;padding:0px;background-color:rgb(106,120,209)" target="_blank"><img src="https://cdn2.hubspot.net/hubfs/53/tools/email-signature-generator/icons/linkedin-icon-2x.png" alt="linkedin" color="#6A78D1" height="24" style="max-width:135px;display:block"></a></td><td width="5" style="color:rgb(255,255,255);font-family:"Trebuchet MS""></td></tr></tbody></table></td></tr></tbody></table></td></tr></tbody></table></div></div></div></div>