<div dir="ltr"><div class="gmail_extra"><div><div class="gmail_signature"><div dir="ltr"><div><br></div></div></div></div>
<br><div class="gmail_quote">2015-10-01 9:30 GMT-04:00 Dejan Muhamedagic <span dir="ltr"><<a href="mailto:dejanmm@fastmail.fm" target="_blank">dejanmm@fastmail.fm</a>></span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Hi,<br>
<span class=""><br>
On Wed, Sep 30, 2015 at 02:24:32PM -0400, Luc Paulin wrote:<br>
> Hi Everyone,<br>
> I have experience a weird issue last night where our cluster try to<br>
> failover due to an "Unkown interface"<br>
><br>
> Look like when the IPaddr2 monitor try to perform a status on eth0, it<br>
> didn't find the device. Both node are VM. I haven't found any reason as why<br>
> eth0 would have "disapear"<br>
><br>
> <LOG NODE1><br>
</span>> [...]<br>
<span class="">> Sep 29 21:25:06 node-02 pengine[3240]:    error: unpack_rsc_op: Preventing<br>
> vip_v207_174 from re-starting anywhere: operation monitor failed 'not<br>
> configured' (6)<br>
<br>
</span>The RA exits with the error code which says that the resource<br>
configuration is invalid. Hence PE won't try to start that<br>
resource again. Normally, we don't expect network interfaces to<br>
disappear, but this should probably be the "not installed" error,<br>
so that the resource can be started on another node. Or even the<br>
"generic" error in case it may be expected that interfaces can<br>
come and go. Did you figure why the interface disappeared?<br>
<br>
</blockquote><div><br></div><div>No we haven't been able to figure out why the interface disappeared. Actually it doesn't seem to have disappeared as we have no evidence that interface was gone from kernel log.  As you say this should probably have be in the "not intstalled" or "generic" error so it tries to start it on another node, but obviously, network interface that disapear is not something that we expect to see. </div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Thanks,<br>
<br>
Dejan<br>
<div><div class="h5"><br>
> I know that I found some post that say to run sysctl -w<br>
> net.ipv4.conf.all.promote_secondaries=1 to avoid secondary nic to be remove<br>
> when primary is gone, but in this case the eth0 has a single nic that is<br>
> manage through IPaddr2 within crm configuration<br>
><br>
> Here's the configuration or node:<br>
><br>
> <CONFIGURATION><br>
> Cluster Name: nodecluster1<br>
> Corosync Nodes:<br>
>  node-01 node-02<br>
> Pacemaker Nodes:<br>
>  node-01 node-02<br>
><br>
> Resources:<br>
>  Group: lbpcivip<br>
>   Resource: vip_v207_174 (class=ocf provider=heartbeat type=IPaddr2)<br>
>    Attributes: ip=x.x.x.174 cidr_netmask=27 broadcast=x.x.x.191 nic=eth0<br>
>    Operations: monitor interval=10s (vip_v207_174-monitor-interval-10s)<br>
>   Resource: vip_v26_1 (class=ocf provider=heartbeat type=IPaddr2)<br>
>    Attributes: ip=x.x.26.1<br>
>    Operations: monitor interval=10s (vip_v26_1-monitor-interval-10s)<br>
>   Resource: vip_v27_1 (class=ocf provider=heartbeat type=IPaddr2)<br>
>    Attributes: ip=x.x.27.1<br>
>    Operations: monitor interval=10s (vip_v27_1-monitor-interval-10s)<br>
>   Resource: vip_v254_230 (class=ocf provider=heartbeat type=IPaddr2)<br>
>    Attributes: ip=x.x.254.230<br>
>    Operations: monitor interval=10s (vip_v254_230-monitor-interval-10s)<br>
>   Resource: change-default-fw (class=lsb type=fwdefaultgw)<br>
>    Operations: monitor interval=60s (change-default-fw-monitor-interval-60s)<br>
>   Resource: fwcorp-mailto-sysadmin (class=ocf provider=heartbeat<br>
> type=MailTo)<br>
>    Attributes: email=<a href="mailto:its@touchtunes.com">its@touchtunes.com</a> subject="[node - Clustered<br>
> services]"<br>
>    Operations: monitor interval=60s<br>
> (fwcorp-mailto-sysadmin-monitor-interval-60s)<br>
><br>
> Stonith Devices:<br>
> Fencing Levels:<br>
><br>
> Location Constraints:<br>
> Ordering Constraints:<br>
> Colocation Constraints:<br>
><br>
> Cluster Properties:<br>
>  cluster-infrastructure: cman<br>
>  dc-version: 1.1.11-97629de<br>
>  last-lrm-refresh: 1412269491<br>
>  no-quorum-policy: ignore<br>
>  stonith-enabled: false<br>
> </CONFIGURATION><br>
><br>
> Has anyone have suggestion on how I can solve this issue? Why did the<br>
> failover from node1 to node2 didn't work ?<br>
><br>
> If more information is require let me know, any suggestion would be<br>
> appreciated!<br>
><br>
> Thanx!<br>
><br>
><br>
> --<br>
>                          !!!!!<br>
>                        ( o o )<br>
>  --------------oOO----(_)----OOo--------------<br>
>    Luc Paulin<br>
>    email: paulinster(at)<a href="http://gmail.com" rel="noreferrer" target="_blank">gmail.com</a><br>
>    Skype: paulinster<br>
<br>
</div></div>> _______________________________________________<br>
> Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
> <a href="http://clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
><br>
> Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
<br>
<br>
_______________________________________________<br>
Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
<a href="http://clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
</blockquote></div><br></div></div>