<div dir="ltr"><div>Hi,</div><div><br></div><div><br></div><div>I have configured wildfly resource in master slave mode on a 6 VM cluster with stonith disabled and and no quorum policy set to ignore.</div><div><br></div><div>We are observing that on either of master or slave resource failure, pacemaker keeps on calling stateful_monitor for wildfly repeatedly, despite us returning appropriate failure return codes on monitor failure for both master (rc=OCF_MASTER_FAILED) and slave (rc=OCF_NOT_RUNNING).</div><div><br></div><div>This continues till failure-timeout is reached after which the resource gets demoted and stopped in case of master monitor failure and stopped in case of slave monitor failure.</div><div><br></div><div><div># pacemakerd --version</div><div>Pacemaker 1.1.16</div><div>Written by Andrew Beekhof</div></div><div><br></div><div><div># corosync -v</div><div>Corosync Cluster Engine, version '2.4.2'</div><div>Copyright (c) 2006-2009 Red Hat, Inc.</div></div><div><br></div><div>Below is my configuration:</div><div><br></div><div>node 1: VM-0</div><div>node 2: VM-1</div><div>node 3: VM-2</div><div>node 4: VM-3</div><div>node 5: VM-4</div><div>node 6: VM-5</div><div>primitive stateful_wildfly ocf:pacemaker:wildfly \</div><div>        op start timeout=200s interval=0 \</div><div>        op promote timeout=300s interval=0 \</div><div>        op monitor interval=90s role=Master timeout=90s \</div><div>        op monitor interval=80s role=Slave timeout=100s \</div><div>        meta resource-stickiness=100 migration-threshold=3 failure-timeout=240s</div><div>ms wildfly_MS stateful_wildfly \</div><div>location stateful_wildfly_rule_2 wildfly_MS \</div><div>        rule -inf: #uname eq VM-2</div><div>location stateful_wildfly_rule_3 wildfly_MS \</div><div>        rule -inf: #uname eq VM-3</div><div>location stateful_wildfly_rule_4 wildfly_MS \</div><div>        rule -inf: #uname eq VM-4</div><div>location stateful_wildfly_rule_5 wildfly_MS \</div><div>        rule -inf: #uname eq VM-5</div><div>property cib-bootstrap-options: \</div><div>        stonith-enabled=false \</div><div>        no-quorum-policy=ignore \</div><div>        cluster-recheck-interval=30s \</div><div>        start-failure-is-fatal=false \</div><div>        stop-all-resources=false \</div><div>        have-watchdog=false \</div><div>        dc-version=1.1.16-94ff4df51a \</div><div>        cluster-infrastructure=corosync \</div><div>        cluster-name=hacluster-0</div><div><br></div><div>Could you please help us in understanding this behavior and how to fix this?</div><div><br></div><div><br></div><div>Thanks!<br>Samarth J</div><div><br><br><br></div></div>