<div dir="ltr"><div><div><div><div><div><div>Hello Cluster guru's.<br><br></div>I'm having a bit of trouble with a cluster of ours. After an outage of 1 node it went into a split brain situation where both nodes aren't talking to each other. Both say the other node is offline. I've tried to get them both up and running again by stopping and starting the cluster services on both nodes, one at a time. with out luck.<br><br></div>I've been trying to reproduce the problem with a set of test servers but i can't seem to get it in the same state. <br><br></div>Because of this i'm looking for some help because i'm not that known with pacemaker/corosync.<br><br></div>this is the output of the command pcs status:<br>Cluster name: MXloadbalancer
<br>Last updated: Mon Nov 16 10:18:44 2015
<br>Last change: Fri Nov  6 15:35:22 2015
<br>Stack: corosync
<br>Current DC: bckilb01 (1) - partition WITHOUT quorum
<br>Version: 1.1.12-a14efad
<br>2 Nodes configured
<br>3 Resources configured
<br><br>Online: [ bckilb01 ]
<br>OFFLINE: [ bckilb02 ]

<br><br>Full list of resources:<br> haproxy        (systemd:haproxy):      Stopped
 <br><br>Resource Group: MXVIP
     <br>ip-192.168.250.200 (ocf::heartbeat:IPaddr2): Stopped
     <br>ip-192.168.250.201 (ocf::heartbeat:IPaddr2):       Stopped

<br><br>PCSD Status:
  <br>bckilb01: Online
  <br>bckilb02: Online

<br><br>Daemon Status:
  <br>corosync: active/enabled
  <br>pacemaker: active/enabled
  <br>pcsd: active/enabled
<br></div><br><br></div><div>And the config:<br>totem {
<br>version: 2
<br>secauth: off
<br>cluster_name: MXloadbalancer
<br>transport: udpu
}<br> <br>nodelist {
  <br>node {
        ring0_addr: bckilb01
        nodeid: 1
       }
  <br>node {
        ring0_addr: bckilb02
        nodeid: 2
       }
}

<br>quorum {
provider: corosync_votequorum
two_node: 1
}

<br>logging {
to_syslog: yes
}<br><br></div><div>If any has an idea about how to get them working together again please let me know.<br><br></div><div>Greetings Richard<br></div></div>