<div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif;font-size:small">Are both machines identical hardware/version/model? We found that machines with different CPU features crash while migrating from the machine with more features to one with few features.</div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif;font-size:small">Also are your STONITH ok? STONITH protects from that muti-running behavior.</div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif;font-size:small"><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 8, 2015 at 9:29 AM, Ulrich Windl <span dir="ltr"><<a href="mailto:Ulrich.Windl@rz.uni-regensburg.de" target="_blank">Ulrich.Windl@rz.uni-regensburg.de</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi!<br>
<br>
I'd like to report an "interesting problem" with SLES11 SP3+HAE (latest updates):<br>
<br>
When doing "rcopenais stop" on node "h10" with three Xen-VMs running, the cluster tried to migrate those VMs to other nodes (OK).<br>
<br>
However migration failed on the remote nodes, but the cluster thought migration was successfully. Later the cluster restarted the VMs (BAD).<br>
<br>
Oct  8 13:19:17 h10 Xen(prm_xen_v07)[16537]: INFO: v07: xm migrate to h01 succeeded.<br>
Oct  8 13:20:38 h01 Xen(prm_xen_v07)[9027]: ERROR: v07: Not active locally, migration failed!<br>
<br>
Oct  8 13:44:53 h01 pengine[18985]:  warning: unpack_rsc_op_failure: Processing failed op migrate_from for prm_xen_v07 on h01: unknown error (1)<br>
<br>
Things are really bad after h10 was rebooted eventually: The cluster restarted the three VMs again, because it thought those VMs were still running on h10! (VERY BAD)<br>
During startup, the cluster did nor probe the three VMs.<br>
<br>
Oct  8 14:14:20 h01 pengine[18985]:  warning: unpack_rsc_op_failure: Processing failed op migrate_from for prm_xen_v07 on h01: unknown error (1)<br>
<br>
Oct  8 14:14:20 h01 pengine[18985]:   notice: LogActions: Restart prm_xen_v07 (Started h10)<br>
<br>
Oct  8 14:14:20 h01 crmd[18986]:   notice: te_rsc_command: Initiating action 89: stop prm_xen_v07_stop_0 on h01 (local)<br>
<br>
...<br>
<br>
Regards,<br>
Ulrich<br>
<br>
<br>
<br>
_______________________________________________<br>
Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
<a href="http://clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature">Cleber Paiva de Souza</div>
</div>