I'm pretty sure the behavior outlined below is by design (and it does make sense logically) but I am wondering if there are additional checks that can be put in place to change the behavior.<div><br></div><div>Situation:</div>
<div>- Two node cluster with IPMI STONITH configured</div><div>- Both servers running but with openais / pacemaker shutdown</div><div>- Start openais on one server only</div><div>- Server that starts executes a STONITH reset of the other node</div>
<div><br></div><div>I imagine this is due to an indeterminate state / no comms between nodes, the only way to move to a known state is then to bounce the other node. Is this correct ?</div><div><br></div><div>Is there any way to configure alternate means of confirming the openais / pacemaker service is not started and avoid a hard reset on the 'other' node ? ie: log in via ssh and enquire on service state, maybe even check key resources etc ?</div>
<div><br></div><div>Is the preferred method to always run openais / pacemaker on all nodes and manipulate rules to determine where resources run ? typically i would just shutdown openais to force all resources to one node or the other to simplify config creation and testing etc.</div>