Hello,<br><br>does anyone have an idea ? <br><br>it seems that at 13:06:38 resources et started on slave member.<br>But then there is something wrong on server01 :<br><br>Feb  8 13:06:39 server01 pengine: [19469]: info: determine_online_status: Node server01 is online<br>
Feb  8 13:06:39 server01 pengine: [19469]: notice: unpack_rsc_op: Operation apache2_monitor_0 found resource apache2 active on server01<br>Feb  8 13:06:39 server01 pengine: [19469]: notice: group_print:  Resource Group: supervision-grp<br>
Feb  8 13:06:39 server01 pengine: [19469]: notice: native_print:      fs-data    (ocf::heartbeat:Filesystem):    Stopped <br>Feb  8 13:06:39 server01 pengine: [19469]: notice: native_print:      nagios-ip    (ocf::heartbeat:IPaddr2):    Stopped <br>
Feb  8 13:06:39 server01 pengine: [19469]: notice: native_print:      apache2    (ocf::heartbeat:apache):    Started server01<br>Feb  8 13:06:39 server01 pengine: [19469]: notice: native_print:      nagios    (lsb:nagios3):    Stopped <br>
<br><br>But I don't understand what fails if this is DRBD or apache2 causes the issue.<br><br>Any idea ?<br><br><br><div class="gmail_quote">On 10 February 2012 09:39, Hugo Deprez <span dir="ltr"><<a href="mailto:hugo.deprez@gmail.com">hugo.deprez@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello,<br><br>please found attach to this mail the corosync logs.<br>If you have any tips :)<br><br><br><br>Regards,<br>
<br>Hugo<div class="HOEnZb"><div class="h5"><br><br><div class="gmail_quote">On 8 February 2012 15:39, Florian Haas <span dir="ltr"><<a href="mailto:florian@hastexo.com" target="_blank">florian@hastexo.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>On Wed, Feb 8, 2012 at 2:29 PM, Hugo Deprez <<a href="mailto:hugo.deprez@gmail.com" target="_blank">hugo.deprez@gmail.com</a>> wrote:<br>



> Dear community,<br>
><br>
> I am currently running different corosync / drbd cluster using VM running on<br>
> vmware esxi host.<br>
> Guest Os are Debian Squeeze.<br>
><br>
> the active member of the cluster just freeze the VM was unreachable.<br>
> But the resources didn't achieved to move to the other node.<br>
><br>
> My cluster has the following ressources :<br>
><br>
> Resource Group: grp<br>
>      fs-data    (ocf::heartbeat:Filesystem):<br>
>      nagios-ip  (ocf::heartbeat:IPaddr2):<br>
>      apache2    (ocf::heartbeat:apache):<br>
>      nagios     (lsb:nagios3):<br>
>      pnp        (lsb:npcd):<br>
><br>
><br>
> I am currently troubleshooting this issue. I don't really know where to<br>
> look. Of course I had a look at the logs, but it is pretty hard for me to<br>
> understand what happen.<br>
<br>
</div>It's pretty hard for anyone else to understand _without_ logs. :)<br>
<div><br>
> I noticed that the VM crash at 12:09 and that the cluster only try to move<br>
> the ressources at  12:58, this does not make sens for me. Or maybe the host<br>
> wasn't totaly down ?<br>
><br>
> Do you have any idea how I can troubleshoot ?<br>
<br>
</div>Log analysis is where I would start.<br>
<div><br>
> Last thing, I notice that If I start apache2 on the slave server, corosync<br>
> didn't detect that the resource is started, could that be an issue ?<br>
<br>
</div>Sure it could, but Pacemaker should happily recover from that.<br>
<br>
Cheers,<br>
Florian<br>
<span><font color="#888888"><br>
--<br>
Need help with High Availability?<br>
<a href="http://www.hastexo.com/now" target="_blank">http://www.hastexo.com/now</a><br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</font></span></blockquote></div><br>
</div></div></blockquote></div><br>