Hello Andrew,<br><br>in fact DRBD was in standalone mode but the cluster was working :<br><br>Here is the syslog of the drbd's split brain :<br><br>Jul 15 08:45:34 node1 kernel: [1536023.052245] block drbd0: Handshake successful: Agreed network protocol version 91<br>
Jul 15 08:45:34 node1 kernel: [1536023.052267] block drbd0: conn( WFConnection -> WFReportParams )<br>Jul 15 08:45:34 node1 kernel: [1536023.066677] block drbd0: Starting asender thread (from drbd0_receiver [23281])<br>
Jul 15 08:45:34 node1 kernel: [1536023.066863] block drbd0: data-integrity-alg: <not-used><br>Jul 15 08:45:34 node1 kernel: [1536023.079182] block drbd0: drbd_sync_handshake:<br>Jul 15 08:45:34 node1 kernel: [1536023.079190] block drbd0: self BBA9B794EDB65CDF:9E8FB52F896EF383:C5FE44742558F9E1:1F9E06135B8E296F bits:75338 flags:0<br>
Jul 15 08:45:34 node1 kernel: [1536023.079196] block drbd0: peer 8343B5F30B2BF674:9E8FB52F896EF382:C5FE44742558F9E0:1F9E06135B8E296F bits:769 flags:0<br>Jul 15 08:45:34 node1 kernel: [1536023.079200] block drbd0: uuid_compare()=100 by rule 90<br>
Jul 15 08:45:34 node1 kernel: [1536023.079203] block drbd0: Split-Brain detected, dropping connection!<br>Jul 15 08:45:34 node1 kernel: [1536023.079439] block drbd0: helper command: /sbin/drbdadm split-brain minor-0<br>Jul 15 08:45:34 node1 kernel: [1536023.083955] block drbd0: meta connection shut down by peer.<br>
Jul 15 08:45:34 node1 kernel: [1536023.084163] block drbd0: conn( WFReportParams -> NetworkFailure )<br>Jul 15 08:45:34 node1 kernel: [1536023.084173] block drbd0: asender terminated<br>Jul 15 08:45:34 node1 kernel: [1536023.084176] block drbd0: Terminating asender thread<br>
Jul 15 08:45:34 node1 kernel: [1536023.084406] block drbd0: helper command: /sbin/drbdadm split-brain minor-0 exit code 0 (0x0)<br>Jul 15 08:45:34 node1 kernel: [1536023.084420] block drbd0: conn( NetworkFailure -> Disconnecting )<br>
Jul 15 08:45:34 node1 kernel: [1536023.084430] block drbd0: error receiving ReportState, l: 4!<br>Jul 15 08:45:34 node1 kernel: [1536023.084789] block drbd0: Connection closed<br>Jul 15 08:45:34 node1 kernel: [1536023.084813] block drbd0: conn( Disconnecting -> StandAlone )<br>
Jul 15 08:45:34 node1 kernel: [1536023.086345] block drbd0: receiver terminated<br>Jul 15 08:45:34 node1 kernel: [1536023.086349] block drbd0: Terminating receiver thread<br><br><br><div class="gmail_quote">On 19 July 2011 02:30, Andrew Beekhof <span dir="ltr"><<a href="mailto:andrew@beekhof.net">andrew@beekhof.net</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">On Fri, Jul 15, 2011 at 7:58 PM, Hugo Deprez <<a href="mailto:hugo.deprez@gmail.com">hugo.deprez@gmail.com</a>> wrote:<br>

> Dear community,<br>
><br>
> I am running on Debian Lenny, a cluster with corosync. I have :<br>
><br>
> One DRBD partition and 4 resources :<br>
><br>
> fs-data    (ocf::heartbeat:Filesystem):<br>
> mda-ip     (ocf::heartbeat:IPaddr2):<br>
> postfix    (ocf::heartbeat:postfix):<br>
> apache     (ocf::heartbeat:apache):<br>
><br>
> Last night something happens and DRBD had a 'split brain'. I think the split<br>
> brain come from<br>
><br>
> The resources was still running on the node 1.<br>
><br>
> I checked the corosync logs and seems that something went wrong, I would<br>
> like to understand what happen, in order to improve my cluster<br>
> configuration.<br>
><br>
> Please find attach  the log file.<br>
<br>
</div>I see no evidence of a split-brain. Both nodes appear to be able to<br>
talk to each other.<br>
What exactly is the problem you encountered?<br>
<div class="im"><br>
><br>
> It seems that the cluster tried to migrate the resources to the other node<br>
> but didn't succeed ?<br>
><br>
> Any help appreciated.<br>
><br>
> Regards,<br>
><br>
> Hugo<br>
><br>
</div>> _______________________________________________<br>
> Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
> <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
><br>
> Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs:<br>
> <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>
><br>
><br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>
</blockquote></div><br>