<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none"><!--P{margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr" style="font-size:12pt;color:#000000;background-color:#FFFFFF;font-family:Calibri,Arial,Helvetica,sans-serif;">
<p>Hi All,</p>
<p><br>
</p>
<p>I'm running Pacemaker 2.0.1 on a cluster containing two nodes; one master and one slave. I have a main master/slave resource (m_main_system), a group of resources that run in active-active mode (active_active - i.e. run on both nodes), and a group that runs
 in active-disabled mode (snmp_active_disabled - resources only run on the current promoted master). The snmp_active_disabled group is configured to be co-located with the master of m_main_system, so only a failure of the master m_main_system resource can trigger
 a failover. The constraints specify that m_main_system must be started before snmp_active_disabled.<br>
</p>
<p><br>
</p>
<p>The problem I'm having is that when a resource in the snmp_active_disabled group fails and gets into a constant cycle where Pacemaker tries to restart it, and I then kill m_main_system on the master, then Pacemaker still constantly tries to restart the failed
 snmp_active_disabled resource and ignores the more important m_main_system process which should be triggering a failover. If I stabilise the snmp_active_disabled resource then Pacemaker finally acts on the m_main_system failure. I hope I've described this
 well enough, but I've included a cut down form of my CIB config below if it helps!</p>
<p><br>
</p>
<p>Is this a bug or an error in my config? Perhaps the order in which the groups are defined in the CIB matters despite the constraints? Any help would be gratefully received.</p>
<p><br>
</p>
<p>Thanks,</p>
<p>Harvey</p>
<p><br>
</p>
<p><em><configuration></em><br>
<em>  <crm_config></em><br>
<em>    <cluster_property_set id="cib-bootstrap-options"></em><br>
<em>      <nvpair name="stonith-enabled" value="false" id="cib-bootstrap-options-stonith-enabled"/></em><br>
<em>      <nvpair name="no-quorum-policy" value="ignore" id="cib-bootstrap-options-no-quorum-policy"/></em><br>
<em>      <nvpair name="have-watchdog" value="false" id="cib-bootstrap-options-have-watchdog"/></em><br>
<em>      <nvpair name="cluster-name" value="lbcluster" id="cib-bootstrap-options-cluster-name"/></em><br>
<em>      <nvpair name="start-failure-is-fatal" value="false" id="cib-bootstrap-options-start-failure-is-fatal"/></em><br>
<em>      <nvpair name="cluster-recheck-interval" value="0s" id="cib-bootstrap-options-cluster-recheck-interval"/></em><br>
<em>    </cluster_property_set></em><br>
<em>  </crm_config></em><br>
<em>  <nodes></em><br>
<em>    <node id="1" uname="primary"/></em><br>
<em>    <node id="2" uname="secondary"/></em><br>
<em>  </nodes></em><br>
<em>  <resources></em><br>
<em>    <group id="snmp_active_disabled"></em><br>
<em>        <primitive id="snmpd" class="lsb" type="snmpd"></em><br>
<em>          <operations></em><br>
<em>            <op name="monitor" interval="10s" id="snmpd-monitor-10s"/></em><br>
<em>            <op name="start" interval="0" timeout="30s" id="snmpd-start-30s"/></em><br>
<em>            <op name="stop" interval="0" timeout="30s" id="snmpd-stop-30s"/></em><br>
<em>          </operations></em><br>
<em>        </primitive></em><br>
<em>        <primitive id="snmp-auxiliaries" class="lsb" type="snmp-auxiliaries"></em><br>
<em>          <operations></em><br>
<em>            <op name="monitor" interval="10s" id="snmp-auxiliaries-monitor-10s"/></em><br>
<em>            <op name="start" interval="0" timeout="30s" id="snmp-auxiliaries-start-30s"/></em><br>
<em>            <op name="stop" interval="0" timeout="30s" id="snmp-auxiliaries-stop-30s"/></em><br>
<em>          </operations></em><br>
<em>        </primitive></em><br>
<em>    </group></em><br>
<em>    <clone id="clone_active_active"></em><br>
<em>      <meta_attributes id="clone_active_active_meta_attributes"></em><br>
<em>        <nvpair id="group-unique" name="globally-unique" value="false"/></em><br>
<em>      </meta_attributes></em><br>
<em>      <group id="active_active"></em><br>
<em>        <primitive id="logd" class="lsb" type="logd"></em><br>
<em>          <operations></em><br>
<em>            <op name="monitor" interval="10s" id="logd-monitor-10s"/></em><br>
<em>            <op name="start" interval="0" timeout="30s" id="logd-start-30s"/></em><br>
<em>            <op name="stop" interval="0" timeout="30s" id="logd-stop-30s"/></em><br>
<em>          </operations></em><br>
<em>        </primitive></em><br>
<em>        <primitive id="serviced" class="lsb" type="serviced"></em><br>
<em>          <operations></em><br>
<em>            <op name="monitor" interval="10s" id="serviced-monitor-10s"/></em><br>
<em>            <op name="start" interval="0" timeout="30s" id="serviced-start-30s"/></em><br>
<em>            <op name="stop" interval="0" timeout="30s" id="serviced-stop-30s"/></em><br>
<em>          </operations></em><br>
<em>        </primitive></em><br>
<em>      </group></em><br>
<em>    </clone></em><br>
<em>    <master id="m_main_system"></em><br>
<em>      <meta_attributes id="m_main_system-meta_attributes"></em><br>
<em>        <nvpair name="notify" value="true" id="m_main_system-meta_attributes-notify"/></em><br>
<em>        <nvpair name="clone-max" value="2" id="m_main_system-meta_attributes-clone-max"/></em><br>
<em>        <nvpair name="promoted-max" value="1" id="m_main_system-meta_attributes-promoted-max"/></em><br>
<em>        <nvpair name="promoted-node-max" value="1" id="m_main_system-meta_attributes-promoted-node-max"/></em><br>
<em>      </meta_attributes></em><br>
<em>      <primitive id="main_system" class="ocf" provider="acme" type="main-system-ocf"></em><br>
<em>        <operations></em><br>
<em>          <op name="start" interval="0" timeout="120s" id="main_system-start-0"/></em><br>
<em>          <op name="stop" interval="0" timeout="120s" id="main_system-stop-0"/></em><br>
<em>          <op name="promote" interval="0" timeout="120s" id="main_system-promote-0"/></em><br>
<em>          <op name="demote" interval="0" timeout="120s" id="main_system-demote-0"/></em><br>
<em>          <op name="monitor" interval="10s" timeout="10s" role="Master" id="main_system-monitor-10s"/></em><br>
<em>          <op name="monitor" interval="11s" timeout="10s" role="Slave" id="main_system-monitor-11s"/></em><br>
<em>          <op name="notify" interval="0" timeout="60s" id="main_system-notify-0"/></em><br>
<em>         </operations></em><br>
<em>       </primitive></em><br>
<em>    </master></em><br>
<em>  </resources></em><br>
<em>  <constraints></em><br>
<em>    <rsc_colocation id="master_only_snmp_rscs_with_main_system" score="INFINITY" rsc="snmp_active_disabled" with-rsc="m_main_system" with-rsc-role="Master"/></em><br>
<em>    <rsc_order id="snmp_active_disabled_after_main_system" kind="Mandatory" first="m_main_system" then="snmp_active_disabled"/></em><br>
<em>    <rsc_order id="active_active_after_main_system" kind="Mandatory" first="m_main_system" then="clone_active_active"/></em><br>
<em>  </constraints></em><br>
<em>  <rsc_defaults></em><br>
<em>    <meta_attributes id="rsc-options"></em><br>
<em>      <nvpair name="resource-stickiness" value="1" id="rsc-options-resource-stickiness"/></em><br>
<em>      <nvpair name="migration-threshold" value="0" id="rsc-options-migration-threshold"/></em><br>
<em>      <nvpair name="requires" value="nothing" id="rsc-options-requires"/></em><br>
<em>    </meta_attributes></em><br>
<em>  </rsc_defaults></em><br>
<em></configuration></em><br>
<br>
</p>
<p><br>
</p>
<p><br>
</p>
</body>
</html>