<div dir="auto">Hi - As you can see in the corosync.conf details - i have already kept debug: on<div dir="auto"><br></div><div dir="auto">Thanks!</div></div><br><div class="gmail_quote"><div dir="ltr">On Thu, 7 Jun 2018, 8:03 pm Christine Caulfield, <<a href="mailto:ccaulfie@redhat.com">ccaulfie@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On 07/06/18 15:24, Prasad Nagaraj wrote:<br>
> <br>
> No iptables or otherwise firewalls are setup on these nodes.<br>
> <br>
> One observation is that each node sends messages on with its own ring<br>
> sequence number which is not converging.. I have seen that in a good<br>
> cluster, when nodes respond with same sequence number, the membership is<br>
> automatically formed. But in our case, that is not the case.<br>
> <br>
<br>
That's just a side-effect of the cluster not forming. It's not causing<br>
it. Can you enable full corosync debugging (just add debug:on to the end<br>
of the logging {} stanza) and see if that has any more useful<br>
information (I only need the corosync bits, not the pcmk ones)<br>
<br>
Chrissie<br>
<br>
> Example: we can see that one node sends<br>
> Jun 07 07:55:04 corosync [pcmk  ] notice: pcmk_peer_update: Transitional<br>
> membership event on ring 71084: memb=1, new=0, lost=0<br>
> .....<br>
> Jun 07 07:55:16 corosync [pcmk  ] notice: pcmk_peer_update: Transitional<br>
> membership event on ring 71096: memb=1, new=0, lost=0<br>
> Jun 07 07:55:16 corosync [pcmk  ] notice: pcmk_peer_update: Stable<br>
> membership event on ring 71096: memb=1, new=0, lost=0<br>
> <br>
> other node sends messages with its own numbers<br>
> Jun 07 07:55:12 corosync [pcmk  ] notice: pcmk_peer_update: Transitional<br>
> membership event on ring 71088: memb=1, new=0, lost=0<br>
> Jun 07 07:55:12 corosync [pcmk  ] notice: pcmk_peer_update: Stable<br>
> membership event on ring 71088: memb=1, new=0, lost=0<br>
> .......<br>
> Jun 07 07:55:24 corosync [pcmk  ] notice: pcmk_peer_update: Transitional<br>
> membership event on ring 71100: memb=1, new=0, lost=0<br>
> Jun 07 07:55:24 corosync [pcmk  ] notice: pcmk_peer_update: Stable<br>
> membership event on ring 71100: memb=1, new=0, lost=0<br>
> <br>
> Any idea why this happens, and why the seq. numbers from different nodes<br>
> are not converging ?<br>
> <br>
> Thanks!<br>
> <br>
> <br>
> <br>
> <br>
> <br>
> _______________________________________________<br>
> Users mailing list: <a href="mailto:Users@clusterlabs.org" target="_blank" rel="noreferrer">Users@clusterlabs.org</a><br>
> <a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
> <br>
> Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
> <br>
<br>
_______________________________________________<br>
Users mailing list: <a href="mailto:Users@clusterlabs.org" target="_blank" rel="noreferrer">Users@clusterlabs.org</a><br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
</blockquote></div>