<div dir="ltr"><div><div>
<div>Hi,</div><div><br></div><div><br></div><div>I have configured 
wildfly resource in master slave mode on a 6 VM cluster with stonith 
disabled and and no quorum policy set to ignore.</div><div><br></div><div>We
 are observing that on either of master or slave resource failure, 
pacemaker keeps on calling stateful_monitor for wildfly repeatedly, 
despite us returning appropriate failure return codes on monitor failure
 for both master (failure rc=OCF_MASTER_FAILED) and slave (failure rc=OCF_NOT_RUNNING).</div><div><br></div><div>This
 continues till failure-timeout is reached after which the resource gets
 demoted and stopped in case of master monitor failure, and stopped in 
case of slave monitor failure.<br><br></div><div>Could you please help me understand:<br></div><div>Why don't pacemaker demotes or stops resource immediately after first failure, and keeps calling monitor ?<br></div><div><br></div><div><div># pacemakerd --version</div><div>Pacemaker 1.1.16</div><div>Written by Andrew Beekhof</div></div><div><br></div><div><div># corosync -v</div><div>Corosync Cluster Engine, version '2.4.2'</div><div>Copyright (c) 2006-2009 Red Hat, Inc.</div></div><div><br></div><div>Below is my configuration:</div><div><br></div><div>node 1: VM-0</div><div>node 2: VM-1</div><div>node 3: VM-2</div><div>node 4: VM-3</div><div>node 5: VM-4</div><div>node 6: VM-5</div><div>primitive stateful_wildfly ocf:pacemaker:wildfly \</div><div>        op start timeout=200s interval=0 \</div><div>        op promote timeout=300s interval=0 \</div><div>        op monitor interval=90s role=Master timeout=90s \</div><div>        op monitor interval=80s role=Slave timeout=100s \</div><div>        meta resource-stickiness=100 migration-threshold=3 failure-timeout=240s</div><div>ms wildfly_MS stateful_wildfly \</div><div>location stateful_wildfly_rule_2 wildfly_MS \</div><div>        rule -inf: #uname eq VM-2</div><div>location stateful_wildfly_rule_3 wildfly_MS \</div><div>        rule -inf: #uname eq VM-3</div><div>location stateful_wildfly_rule_4 wildfly_MS \</div><div>        rule -inf: #uname eq VM-4</div><div>location stateful_wildfly_rule_5 wildfly_MS \</div><div>        rule -inf: #uname eq VM-5</div><div>property cib-bootstrap-options: \</div><div>        stonith-enabled=false \</div><div>        no-quorum-policy=ignore \</div><div>        cluster-recheck-interval=30s \</div><div>        start-failure-is-fatal=false \</div><div>        stop-all-resources=false \</div><div>        have-watchdog=false \</div><div>        dc-version=1.1.16-94ff4df51a \</div><div>        cluster-infrastructure=corosyn<wbr>c \</div><div>        cluster-name=hacluster-0</div><div><br></div><div>Could you please help us in understanding this behavior and how to fix this?</div>

<br></div>Regards,<br></div>Pankaj<br></div>