<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">2015-06-08 15:25 GMT+02:00 Andrei Borzenkov <span dir="ltr"><<a href="mailto:arvidjaar@gmail.com" target="_blank">arvidjaar@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Mon, Jun 8, 2015 at 3:58 PM, Oscar Salvador<br>
<div><div class="h5"><<a href="mailto:osalvador.vilardaga@gmail.com">osalvador.vilardaga@gmail.com</a>> wrote:<br>
><br>
> 2015-06-08 14:23 GMT+02:00 Andrei Borzenkov <<a href="mailto:arvidjaar@gmail.com">arvidjaar@gmail.com</a>>:<br>
>><br>
>> On Mon, Jun 8, 2015 at 3:05 PM, Oscar Salvador<br>
>> <<a href="mailto:osalvador.vilardaga@gmail.com">osalvador.vilardaga@gmail.com</a>> wrote:<br>
>> > Hi guys!<br>
>> ><br>
>> > I've configured two nodes with the stack pacemaker + corosync, with only<br>
>> > one<br>
>> > resource ( just for test purposes ), and I'm having a strange result.<br>
>> ><br>
>> > First a little bit of information:<br>
>> ><br>
>> > pacemaker version: 1.1.12-1<br>
>> > corosync version: 2.3.4-1<br>
>> ><br>
>> ><br>
>> > # crm configure show<br>
>> > node 1053402612: server1 \<br>
>> > node 1053402613: server2<br>
>> > primitive IP-rsc_apache IPaddr2 \<br>
>> > params ip=xx.xx.xx.xy nic=eth0 cidr_netmask=255.255.255.192 \<br>
>> > meta migration-threshold=2 \<br>
>> > op monitor interval=20 timeout=60 on-fail=standby<br>
>> > property cib-bootstrap-options: \<br>
>> > last-lrm-refresh=1433763004 \<br>
>> > stonith-enabled=false \<br>
>> > no-quorum-policy=ignore<br>
>> ><br>
>> ...<br>
>> ><br>
>> ><br>
>> > It seems like pacemaker is assuming that the monitor-operation failed,<br>
>> > and<br>
>> > because of this, decides to mark the node as a standby. But should not<br>
>> > be,<br>
>> > no?<br>
>> ><br>
>><br>
>> You told it to do exactly that (on-fail=standby).<br>
>><br>
>> _______________________________________________<br>
>> Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
>> <a href="http://clusterlabs.org/mailman/listinfo/users" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
>><br>
>> Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
>> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
>> Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
><br>
><br>
><br>
> Yes, I told that: if the monitor-operation failed, put the node in standby.<br>
> But from my point of view, the monitor-operation doesn't fail, but the<br>
> resource itself.<br>
<br>
</div></div>The only way pacemaker can determine resource failure is by result of<br>
operations. So in a sense resource can never fail - operation can<br>
return unexpected result.<br>
<span class=""><br>
> I'm very stranged with this because as I told, I tested this with and old<br>
> version of pacemaker, and it didn't have this behaviour.<br>
<br>
</span>Here I cannot say anything, sorry; hopefully someone who has been here<br>
for longer time could chime in.<br>
<span class=""><br>
> Maybe I was consufed because of that.<br>
><br>
> So, somehow is reduntant do something like that:<br>
><br>
> meta migration-threshold=2<br>
> op monitor interval=20 timeout=60 on-fail=standby<br>
><br>
> since it will never reach the failcount of 2, no?<br>
><br>
<br>
</span>Migration threshold defines when pacemaker will force resource away<br>
from node. But here you say that node is put in standby as soon as the<br>
first error occurs. So yes, this combination makes no sense IMHO.<br>
<div class="HOEnZb"><div class="h5"><span style="color:rgb(34,34,34)"> </span><br></div></div></blockquote><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">
_______________________________________________<br>
Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
<a href="http://clusterlabs.org/mailman/listinfo/users" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a></div></div></blockquote><div><br></div><div>Thanks to clarify, I was confused due to the old behaviour ;) </div></div><br></div></div>