<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Jun 15, 2021 at 10:41 PM Strahil Nikolov <<a href="mailto:hunter86_bg@yahoo.com">hunter86_bg@yahoo.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Maybe you can try:<div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789457402"><br></div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789458199">while true ; do echo '0' > /proc/sys/kernel/nmi_watchdog ; sleep 1 ; done</div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789504238"><br></div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789504431">and in another shell stop pacemaker and sbd.</div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789526157"><br></div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789612044">I guess the only way to easily reproduce is with sbd over iscsi.</div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789526380"><br></div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789526574">Best Regards,</div><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789533152">Strahil Nikolov<br> <br> <blockquote style="margin:0px 0px 20px"> <div style="font-family:Roboto,sans-serif;color:rgb(109,0,246)"> <div>On Tue, Jun 15, 2021 at 21:30, Andrei Borzenkov</div><div><<a href="mailto:arvidjaar@gmail.com" target="_blank">arvidjaar@gmail.com</a>> wrote:</div> </div> <div style="padding:10px 0px 0px 20px;margin:10px 0px 0px;border-left:1px solid rgb(109,0,246)"> On 15.06.2021 20:48, Strahil Nikolov wrote:<br clear="none">> I'm using 'pcs cluster stop' (or it's crm alternative),yet I'm not sure if it will help in this case.<br clear="none">> <br clear="none"><br clear="none">No it won't. It will still stop pacemaker.</div></blockquote></div></blockquote><div>Guess this is really a delicate issue and we might think of adding</div><div>some handle here. Although of course these kind of handles always</div><div>come with a certain amount of risk that they might be used in a</div><div>way that prevents a node from suiciding when it actually should.</div><div>Unfortunately the way 'pcs cluster stop' avoids suicides of single</div><div>nodes in larger clusters might not work here - first stop pacemaker</div><div>on all nodes and just then stop corosync to keep quorum for long enough</div><div>and to have a quick shutdown of the rest - as on a 2-node-cluster</div><div>sbd actually isn't checking for quorum but for the number of nodes</div><div>registered  with the corosync protocol pacemaker uses.</div><div><br></div><div>Regards,</div><div>Klaus</div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div id="gmail-m_-4483602547218679153yMail_cursorElementTracker_1623789533152"><blockquote style="margin:0px 0px 20px"><div style="padding:10px 0px 0px 20px;margin:10px 0px 0px;border-left:1px solid rgb(109,0,246)"><div id="gmail-m_-4483602547218679153yqtfd62765"><br clear="none"><br clear="none">> Most probably the safest way is to wait for the storage to be recovered, as without the pacemaker<->SBD communication , sbd will stop and the watchdog will be triggered.</div><br clear="none">> <br clear="none"><br clear="none">What makes you think I am not aware of it?<br clear="none"><br clear="none">can you suggest the steps to avoid it?<div id="gmail-m_-4483602547218679153yqtfd77006"><br clear="none"></div> </div> </blockquote></div>_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
</blockquote></div></div>