<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div>Can someone help me with this?</div><div>Background:</div></div></div><blockquote style="margin:0px 0px 0px 40px;border:none;padding:0px"><div dir="ltr"><div dir="ltr"><div>"node01" is failing, and has been placed in "maintenance" mode. It occasionally loses connectivity.</div></div></div></blockquote><blockquote style="margin:0px 0px 0px 40px;border:none;padding:0px"><div dir="ltr"><div dir="ltr"><div>"node02" is able to run our resources</div></div></div></blockquote><div dir="ltr"><div dir="ltr"><div>Consider the following messages from pacemaker.log on "node02", just after "node01" has rejoined the cluster (per "node02"):</div></div><blockquote style="margin:0px 0px 0px 40px;border:none;padding:0px"><div dir="ltr"><div>Jan 28 14:48:03 [21933] <a href="http://node02.example.com">node02.example.com</a>        cib:     info: cib_perform_op:       -- /cib/status/node_state[@id='2']/transient_attributes[@id='2']</div><div>Jan 28 14:48:03 [21933] <a href="http://node02.example.com">node02.example.com</a>        cib:     info: cib_perform_op:       +  /cib:  @num_updates=309</div><div>Jan 28 14:48:03 [21933] <a href="http://node02.example.com">node02.example.com</a>        cib:     info: cib_process_request:  Completed cib_delete operation for section //node_state[@uname='<a href="http://node02.example.com">node02.example.com</a>']/transient_attributes: OK (rc=0, origin=<a href="http://node01.example.com/crmd/3784">node01.example.com/crmd/3784</a>, version=0.94.309)</div><div>Jan 28 14:48:04 [21938] <a href="http://node02.example.com">node02.example.com</a>       crmd:     info: abort_transition_graph:       Transition aborted by deletion of transient_attributes[@id='2']: Transient attribute change | cib=0.94.309 source=abort_unless_down:357 path=/cib/status/node_state[@id='2']/transient_attributes[@id='2'] complete=true</div><div>Jan 28 14:48:05 [21937] <a href="http://node02.example.com">node02.example.com</a>    pengine:     info: master_color: ms_drbd_ourApp: Promoted 0 instances of a possible 1 to master</div><div><br></div></div></blockquote>The implication, it seems to me, is that "node01" has asked "node02" to delete the transient-attributes for "node02". The transient-attributes should normally be:</div><div dir="ltr"><div dir="ltr">      <transient_attributes id="2"></div><div dir="ltr">        <instance_attributes id="status-2"></div><div dir="ltr">          <nvpair id="status-2-master-drbd_ourApp" name="master-drbd_ourApp" value="10000"/></div><div dir="ltr">          <nvpair id="status-2-pingd" name="pingd" value="100"/></div><div dir="ltr">        </instance_attributes></div><div dir="ltr">      </transient_attributes></div><div><br></div><div>These attributes are necessary for "node02" to be Master/Primary, correct? </div><div><br></div><div>Why might this be happening and how do we prevent it?</div><div dir="ltr"><div><br></div></div></div></div></div>