Set the corosync token to 10000 miliseconds and adjust the consensus as per the man 5 corosync.conf and give it a try.<div><br></div><div>Don't forget to sync the corosync settings among the cluster.</div><div><br></div><div>Best Regards,</div><div>Strahil Nikolov<br> <br> <blockquote style="margin: 0 0 20px 0;"> <div style="font-family:Roboto, sans-serif; color:#6D00F6;"> <div>On Fri, Apr 15, 2022 at 15:27, vitaly</div><div><vitaly@unitc.com> wrote:</div> </div> <div style="padding: 10px 0 0 20px; margin: 10px 0 0 0; border-left: 1px solid #6D00F6;"> <div dir="ltr">Hello Everybody.<br></div><div dir="ltr">I am seeing occasionally the following behavior on two node cluster. <br></div><div dir="ltr">1. Abruptly rebooting both nodes of the cluster (using "reboot")<br></div><div dir="ltr">2. Both nodes start to come up. Node d18-3-left (2) comes up first <br></div><div dir="ltr">Apr 13 23:56:09 d18-3-left corosync[11465]:   [MAIN  ] Corosync Cluster Engine ('2.4.4'): started and ready to provide service.<br></div><div dir="ltr"><br></div><div dir="ltr">3. Second node d18-3-right (1) joins the cluster<br></div><div dir="ltr"><br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left corosync[11466]:   [TOTEM ] A new membership (172.16.1.1:60) was formed. Members joined: 1<br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left corosync[11466]:   [QUORUM] This node is within the primary component and will provide service.<br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left corosync[11466]:   [QUORUM] Members[2]: 1 2<br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left corosync[11466]:   [MAIN  ] Completed service synchronization, ready to provide service.<br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left pacemakerd[11717]:   notice: Quorum acquired<br></div><div dir="ltr">Apr 13 23:56:58 d18-3-left crmd[11763]:   notice: Quorum acquired<br></div><div dir="ltr"><br></div><div dir="ltr">4. 2 seconds later node d18-3-left shows I_DC_TIMEOUT and starts fencing of the newly joined node.<br></div><div dir="ltr"><br></div><div dir="ltr">Apr 13 23:57:00 d18-3-left crmd[11763]:  warning: Input I_DC_TIMEOUT received in state S_PENDING from crm_timer_popped<br></div><div dir="ltr">After that we get:<br></div><div dir="ltr">Apr 13 23:57:00 d18-3-left crmd[11763]:   notice: State transition S_ELECTION -> S_INTEGRATION<br></div><div dir="ltr">Apr 13 23:57:00 d18-3-left crmd[11763]:  warning: Input I_ELECTION_DC received in state S_INTEGRATION from do_election_check<br></div><div dir="ltr"><br></div><div dir="ltr">and fence the node:<br></div><div dir="ltr">Apr 13 23:57:01 d18-3-left pengine[11762]:  warning: Scheduling Node d18-3-right.lab.archivas.com for STONITH<br></div><div dir="ltr">Apr 13 23:57:01 d18-3-left pengine[11762]:   notice:  * Fence (reboot) d18-3-right.lab.archivas.com 'node is unclean'<br></div><div dir="ltr"><br></div><div dir="ltr">5. After this the node that was fenced comes up again and joins the cluster without any issues.<br></div><div dir="ltr"><br></div><div dir="ltr">Any idea on what is going on here?<br></div><div dir="ltr">Thanks,<br></div><div dir="ltr">_Vitaly<br></div><div dir="ltr">_______________________________________________<br></div><div dir="ltr">Manage your subscription:<br></div><div dir="ltr"><a href="https://lists.clusterlabs.org/mailman/listinfo/users" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br></div><div dir="ltr"><br></div><div dir="ltr">ClusterLabs home: <a href="https://www.clusterlabs.org/" target="_blank">https://www.clusterlabs.org/</a><br></div> </div> </blockquote></div>