<div dir="ltr">Thanks Alexandre. Changing the  cluster-recheck-interval worked for me :)<div><br></div><div>Regards</div><div>Arjun</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Nov 17, 2014 at 12:44 PM, Alexandre <span dir="ltr"><<a href="mailto:alxgomz@gmail.com" target="_blank">alxgomz@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr"><br>
Le 13 nov. 2014 12:09, "Arjun Pandey" <<a href="mailto:apandepublic@gmail.com" target="_blank">apandepublic@gmail.com</a>> a écrit :<span class=""><br>
><br>
> Hi <br>
><br>
> I am running a 2 node cluster with this config<br>
><br>
> Master/Slave Set: foo-master [foo]<br>
> Masters: [ bharat ]<br>
> Slaves: [ ram ]<br>
> AC_FLT (ocf::pw:IPaddr): Started bharat<br>
> CR_CP_FLT (ocf::pw:IPaddr): Started bharat<br>
> CR_UP_FLT (ocf::pw:IPaddr): Started bharat<br>
> Mgmt_FLT (ocf::pw:IPaddr): Started bharat<br>
><br>
> where IPaddr RA is just modified IPAddr2 RA. Additionally i have a<br>
> collocation constraint for the IP addr to be collocated with the master.<br>
> I have set the migration-threshold as 2 for the VIP. I also have set the failure-timeout to 15s.<br>
><br>
><br>
> Initially i bring down the interface on bharat to force switch-over to ram. After this i fail the interfaces on bharat again. Now i bring the interface up again on ram. However the virtual IP's are now in stopped state.<br>
><br>
> I don't get out of this unless i use crm_resource -C to reset state of resources.<br>
> However if i check failcount of resources after this it's still set as INFINITY.<br>
> Based on the documentation the failcount on a node should have expired after the failure-timeout.That doesn't happen. </span></p>
<p dir="ltr">Expiration probably happens, meaning the failure is marked for expiration. However, expired failures are only removed when the timer pops in, which is defined by the cluster-recheck-interval (by default 15 mins).</p>
<p dir="ltr"><span class="">> However why don't we reset the count after the the crm_resource -C command too. Any other command to actually reset the failcount.<br>
><br>
> Thanks in advance<br>
><br>
> Regards<br>
> Arjun<br>
><br></span><span class="">
> _______________________________________________<br>
> Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
> <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
><br>
> Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
><br>
</span></p>
<br>_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
<br></blockquote></div><br></div>