<div dir="ltr"><div><div><div><div><div><div>Hello Cluster guru&#39;s.<br><br></div>I&#39;m having a bit of trouble with a cluster of ours. After an outage of 1 node it went into a split brain situation where both nodes aren&#39;t talking to each other. Both say the other node is offline. I&#39;ve tried to get them both up and running again by stopping and starting the cluster services on both nodes, one at a time. with out luck.<br><br></div>I&#39;ve been trying to reproduce the problem with a set of test servers but i can&#39;t seem to get it in the same state. <br><br></div>Because of this i&#39;m looking for some help because i&#39;m not that known with pacemaker/corosync.<br><br></div>this is the output of the command pcs status:<br>Cluster name: MXloadbalancer
<br>Last updated: Mon Nov 16 10:18:44 2015
<br>Last change: Fri Nov  6 15:35:22 2015
<br>Stack: corosync
<br>Current DC: bckilb01 (1) - partition WITHOUT quorum
<br>Version: 1.1.12-a14efad
<br>2 Nodes configured
<br>3 Resources configured
<br><br>Online: [ bckilb01 ]
<br>OFFLINE: [ bckilb02 ]

<br><br>Full list of resources:<br> haproxy        (systemd:haproxy):      Stopped
 <br><br>Resource Group: MXVIP
     <br>ip-192.168.250.200 (ocf::heartbeat:IPaddr2): Stopped
     <br>ip-192.168.250.201 (ocf::heartbeat:IPaddr2):       Stopped

<br><br>PCSD Status:
  <br>bckilb01: Online
  <br>bckilb02: Online

<br><br>Daemon Status:
  <br>corosync: active/enabled
  <br>pacemaker: active/enabled
  <br>pcsd: active/enabled
<br></div><br><br></div><div>And the config:<br>totem {
<br>version: 2
<br>secauth: off
<br>cluster_name: MXloadbalancer
<br>transport: udpu
}<br> <br>nodelist {
  <br>node {
        ring0_addr: bckilb01
        nodeid: 1
       }
  <br>node {
        ring0_addr: bckilb02
        nodeid: 2
       }
}

<br>quorum {
provider: corosync_votequorum
two_node: 1
}

<br>logging {
to_syslog: yes
}<br><br></div><div>If any has an idea about how to get them working together again please let me know.<br><br></div><div>Greetings Richard<br></div></div>