<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Hi Klaus,<div>The config is as follows: </div><div>There are 2  nodes in the setup and some resources configured (stonith, IP, systemd services related).</div><div>Sorry, I can share only high level details for this.</div><div><br></div><div>- pacemaker version </div><div># rpm -qa pacemaker<br></div><div><p class="MsoNormal"><span></span></p>

<p class="MsoNormal">pacemaker-2.0.3+20200511.2b248d828-1.10.x86_64<span></span></p><p class="MsoNormal"><br></p><p class="MsoNormal"><span> </span></p><p class="MsoNormal"># rpm -qa corosync<span></span></p><p class="MsoNormal">



</p><p class="MsoNormal">corosync-2.4.5-10.14.6.1.x86_64<span></span></p><p class="MsoNormal"><br></p><p class="MsoNormal"> # rpm -qa crmsh<br></p><p class="MsoNormal">crmsh-4.2.0+git.1585096577.f3257c89-3.4.noarch</p></div><div><br></div></div></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Jun 22, 2022 at 5:45 PM Klaus Wenninger <<a href="mailto:kwenning@redhat.com">kwenning@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On Wed, Jun 22, 2022 at 1:46 PM Priyanka Balotra<br>
<<a href="mailto:priyanka.14balotra@gmail.com" target="_blank">priyanka.14balotra@gmail.com</a>> wrote:<br>
><br>
> Hi All,<br>
><br>
> We are seeing an issue where we performed cluster shutdown followed by cluster boot operation. All the nodes joined the cluster excet one (the first node). Here are some pacemaker logs around that timestamp:<br>
><br>
> 2022-06-19T07:02:08.690213+00:00 FILE-1 pacemaker-fenced[11637]:  notice: Operation 'off' targeting FILE-1 on FILE-2 for pacemaker-controld.11523@FILE-2.0b09e949: OK<br>
><br>
> 2022-06-19T07:02:08.690604+00:00 FILE-1 pacemaker-fenced[11637]:  error: stonith_construct_reply: Triggered assert at fenced_commands.c:2363 : request != NULL<br>
><br>
> 2022-06-19T07:02:08.690781+00:00 FILE-1 pacemaker-fenced[11637]:  warning: Can't create a sane reply<br>
><br>
> 2022-06-19T07:02:08.691872+00:00 FILE-1 pacemaker-controld[11643]:  crit: We were allegedly just fenced by FILE-2 for FILE-2!<br>
><br>
> 2022-06-19T07:02:08.693994+00:00 FILE-1 pacemakerd[11622]:  warning: Shutting cluster down because pacemaker-controld[11643] had fatal failure<br>
><br>
> 2022-06-19T07:02:08.694209+00:00 FILE-1 pacemakerd[11622]:  notice: Shutting down Pacemaker<br>
><br>
> 2022-06-19T07:02:08.694381+00:00 FILE-1 pacemakerd[11622]:  notice: Stopping pacemaker-schedulerd<br>
><br>
><br>
><br>
> Let us know if you need any more logs to find an rca to this.<br>
<br>
A little bit more info about your configuration and the pacemaker-version (cib?)<br>
used would definitely be helpful.<br>
<br>
Klaus<br>
><br>
> Thanks<br>
> Priyanka<br>
> _______________________________________________<br>
> Manage your subscription:<br>
> <a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
><br>
> ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
<br>
_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
</blockquote></div>