Hey,<div><br></div><div>I have two cluster nodes.</div><div><br></div><div>I have a service process which is prone to crash and takes a very long time to start. </div><div>Since the service process takes a long time to start I have the service process running on both nodes, but only the active node with the virtual IP serves the incoming requests.</div>
<div><br></div><div>On both nodes, I have a cron job which periodically checks if the service process is up and if not it starts the service.</div><div><br></div><div>I want pacemaker to periodically check if the service is down on the active node and if so, it switches the virtual IP to the second node (without starting or stopping the my service)</div>
<div><br></div><div>I have the following configuration:</div><div><br></div><div><div>primitive clusterIP ocf:heartbeat:IPaddr2 \</div><div><span class="Apple-tab-span" style="white-space:pre">     </span>params ip="10.0.1.247" \</div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>op monitor interval="10s" timeout="20s"</div><div><br></div><div>primitive serviceMonitoring ocf:serviceMonitoring:serviceMonitoring </div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>params op monitor interval="10s" timeout="20s"</div><div><br></div><div>colocation HACluster inf: serviceMonitoring clusterIP</div><div>
order serviceMonitoring-after-clusterIP inf: clusterIP serviceMonitoring</div></div><div><br></div><div>My serviceMonitoring resource doesn't do anything other than checking the state of the service process. I get the following in the log file:</div>
<div><br></div><div><div>Mar 05 15:07:59 [1543] ha1 pengine:   notice: unpack_rsc_op: Operation monitor found resource serviceMonitoring active on ha2</div><div>Mar 05 15:07:59 [1543] ha1 pengine:   notice: unpack_rsc_op: Operation monitor found resource serviceMonitoring active on ha1</div>
<div>Mar 05 15:07:59 [1543] ha1 pengine:    error: native_create_actions: Resource serviceMonitoring (ocf:: serviceMonitoring) is active on 2 nodes attempting recovery</div><div>Mar 05 15:07:59 [1543] ha1 pengine:  warning: native_create_actions: See <a href="http://clusterlabs.org/wiki/FAQ#Resource_is_Too_Active">http://clusterlabs.org/wiki/FAQ#Resource_is_Too_Active</a> for more information.</div>
</div><div><br></div><div>So it seems that pacemaker calls the monitor method of the serviceMonitoring resource on both nodes.</div><div><br></div><div>Any idea how I can fix this?</div><div><br></div><div>Thanks,</div><div>
Mohica</div><div><br></div>