<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Arial,Helvetica,sans-serif;" dir="ltr">
<p></p>
<pre style="white-space: pre-wrap;">James,

><i> Hey guys,
</i>><i>
</i>><i>
</i>><i> Apologies for burdening you with my issue, but I'm at my wits' end!
</i>><i>
</i>><i>
</i>><i> I'm trying to set up a 2-node cluster on two Ubuntu 16.04 VMs. I actually had this working earlier, but because I had tweaked a number of different settings (both corosync related and external settings), I reverted my VMs back to an earlier checkpoint to ensure I wasn't just running off a luck 'magic config' and I could replicate my setup... turns out, I can't!
</i>><i>
</i>><i>
</i>><i> The config for nodes is as follows:
</i>><i>
</i>><i>
</i>><i> ```
</i>><i>
</i>><i> totem {
</i>><i>    version: 2
</i>><i>    cluster_name: swarm
</i>><i>    transport: udpu
</i>><i>    interface {
</i>><i>      ringnumber: 0
</i>><i>      bindnetaddr: 10.172.0.0
</i>><i>    }
</i>
^^^ Try completely remove interface section

><i> }
</i>><i>
</i>><i> nodelist {
</i>><i>    node {
</i>><i>      ring0_addr: 10.172.0.81
</i>><i>      name: SWARM01
</i>
^^^ What name should do?

><i>      nodeid: 1
</i>><i>    }
</i>><i>    node {
</i>><i>      ring0_addr: 10.172.0.82
</i>><i>      name: SWARM02
</i>><i>      nodeid: 2
</i>><i>    }
</i>><i> }
</i>><i>
</i>><i> quorum {
</i>><i>    provider: corosync_votequorum
</i>><i>    two_node: 1
</i>><i> }
</i>><i>
</i>><i> logging {
</i>><i>    to_logfile: yes
</i>><i>    to_syslog: yes
</i>><i>    logfile: /var/log/corosync/corosync.log
</i>><i>    timestamp: on
</i>><i> }
</i>><i> ```
</i>><i>
</i>><i>
</i>><i>
</i>><i> This time around, when I first run corosync with `systemctl start corosync` it comes up using 127.0.0.1.
</i>><i>
</i>><i>
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [TOTEM ] Initializing transmit/receive security (NSS
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [TOTEM ] The network interface [127.0.0.1] is now up
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [QB    ] server name: cmap
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [QB    ] server name: cfg
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [QB    ] server name: cpg
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [QB    ] server name: votequorum
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [QB    ] server name: quorum
</i>><i> Apr 12 20:28:37 SWARM01 corosync[6025]:   [TOTEM ] A new membership (127.0.0.1:4) was formed.
</i>><i>
</i>><i> Results from `sudo corosync-quorumtool`
</i>><i>
</i>><i> Quorum information
</i>><i> ------------------
</i>><i> Date:             Wed Apr 12 20:31:12 2017
</i>><i> Quorum provider:  corosync_votequorum
</i>><i> Nodes:            1
</i>><i> Node ID:          2130706433
</i>><i> Ring ID:          4
</i>><i> Quorate:          No
</i>><i>
</i>><i> Votequorum information
</i>><i> ----------------------
</i>><i> Expected votes:   2
</i>><i> Highest expected: 2
</i>><i> Total votes:      1
</i>><i> Quorum:           2 Activity blocked
</i>><i> Flags:
</i>><i>
</i>><i> Membership information
</i>><i> ----------------------
</i>><i>      Nodeid      Votes Name
</i>><i> 2130706433          1 localhost (local)
</i>
This really shouldn't happen

><i>
</i>><i> And results from `sudo corosync-cmapctl | grep members`
</i>><i> runtime.totem.pg.mrp.srp.members.2130706433.config_version (u64) = 0
</i>><i> runtime.totem.pg.mrp.srp.members.2130706433.ip (str) = r(0) ip(127.0.0.1)
</i>><i> runtime.totem.pg.mrp.srp.members.2130706433.join_count (u32) = 1
</i>><i> runtime.totem.pg.mrp.srp.members.2130706433.status (str) = joined
</i>><i>
</i>><i> It's also not using the correct node number (Should be 1 or 2 depending on which node I try it on). Then if I try to restart the service, it just fails and doesn't log anything in /var/log/corosync/corosync.log.
</i>
This means corosync.conf is probably ignored.

><i>
</i>><i> Apr 12 20:52:01 SWARM01 systemd[1]: Starting Corosync Cluster Engine...
</i>><i> Apr 12 20:52:01 SWARM01 systemd[1]: corosync.service: Main process exited, code=exited, status=8/n/a
</i>><i> Apr 12 20:52:01 SWARM01 systemd[1]: Failed to start Corosync Cluster Engine.
</i>><i> Apr 12 20:52:01 SWARM01 systemd[1]: corosync.service: Unit entered failed state.
</i>><i> Apr 12 20:52:01 SWARM01 systemd[1]: corosync.service: Failed with result 'exit-code'.
</i>><i>
</i>><i> The only way I can get to test this again is by completely removing corosync (apt remove --purge corosync), reinstalling and trying again. I've tried disabling the firewall completely to see if that was interfering, but to me, it's as if corosync isn't respecting my config file this time around?
</i>
Yes it looks so.

><i>
</i>><i> Any guidance at all would be greatly appreciated!
</i>
Can you please attach your config file? Is corosync from ubuntu package 
or your own compiled one? can you please try to stop corosync service, 
login as root, add "to_stderr: yes" into logging section of config file, 
execute "corosync -f" and paste result?

Regards,
   Honza

><i>
</i>><i>
</i>><i>
</i>><i>
</i>><i> James Booth
</i>><i> Senior ICT Technician
</i>><i> Email: <a href="http://lists.clusterlabs.org/mailman/listinfo/users">james.booth at primarytec.co.uk</a>
</i>><i> Mobile: +44 07725817464
</i>><i>
</i>><i> [<a href="http://www.primarytec.co.uk/wp-content/uploads/2016/11/signature.png">http://www.primarytec.co.uk/wp-content/uploads/2016/11/signature.png</a>]
</i>><i>
</i>><i> Registered in England. No 04760864. Registered office as above
</i>><i>
</i>><i> The information transmitted is intended only for the person or entity to which it is addressed and may contain confidential and/or privileged material. Any review, retransmission, dissemination or other use of, or taking of any action in reliance upon, this information by persons or entities other than the intended recipient is prohibited.
</i>><i> If you received this in error, please contact the sender and delete the material from any computer.
</i>><i>
</i>><i>
</i>><i>
</i>><i> _______________________________________________
</i>><i> Users mailing list: <a href="http://lists.clusterlabs.org/mailman/listinfo/users">Users at clusterlabs.org</a>
</i>><i> <a href="http://lists.clusterlabs.org/mailman/listinfo/users">http://lists.clusterlabs.org/mailman/listinfo/users</a>
</i>><i>
</i>><i> Project Home: <a href="http://www.clusterlabs.org/">http://www.clusterlabs.org</a>
</i>><i> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a>
</i>><i> Bugs: <a href="http://bugs.clusterlabs.org/">http://bugs.clusterlabs.org</a>
</i>><i>
</i></pre>
<div><br>
</div>
<br>
<p></p>
<p><br>
</p>
<p>Apologies, but it looks like my membership to the mailing list hasn't succeeded so I'm trying to manually reply by copying the message content from the archives - I hope it works!</p>
<p><br>
</p>
<p>The current Corosync version I'm using is <span style="font-size: 12pt;">'2.3.5' and it's the Ubuntu package. I've just rebuilt both these VMs (Ubuntu 16.04 again) and I'm getting the same issue. I've also tried compiling the latest version but I'm getting
 held up on the nss requirements. </span></p>
<p><span style="font-size: 12pt;"><br>
</span></p>
<p><span style="font-size: 12pt;">What do you mean about the 'name'? I saw this on examples online, and my nodes are called `SWARM01` and `SWARM02`.</span></p>
<p><span style="font-size: 12pt;"><br>
</span></p>
<p><span style="font-size: 12pt;">Nothing at all seems to work after the first corosync run, it's really odd. I've tried `corosync -f` while running as root and `to_stderr: yes` in the config shows nothing. If I `apt remove --purge` it, I might get another
 run out of it again, but it's baffling me why it only fires the first time, even if it is ignoring the config. I've tried removing the interface segment and running `corosync -t` after every change which shows no output.</span></p>
<p><span style="font-size: 12pt;"><br>
</span></p>
<p><span style="font-size: 12pt;"><br>
</span></p>
<p><br>
</p>
<p>Cheers!<br>
<span style="font-size: 12pt;"></span></p>
<div><br>
</div>
<p></p>
</div>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<meta name="GENERATOR" content="MSHTML 11.00.9600.17728">
<p style="FONT-SIZE: 11px; FONT-FAMILY: Arial, Helvetica, sans-serif; COLOR: #58595B">
<span style="COLOR: #58595B">James Booth</span><br>
<span style="COLOR: #58595B">Senior ICT Technician</span><br>
<span style="COLOR: #F8981D"><strong>Email:</strong></span> james.booth@primarytec.co.uk<br>
<span style="COLOR: #F8981D"><strong>Mobile:</strong></span> +44 07725817464<br>
</p>
<table width="400">
<tbody>
<tr>
<th><img src="http://www.primarytec.co.uk/wp-content/uploads/2016/11/signature.png" style="width:650px;height:90px;"></th>
</tr>
</tbody>
</table>
<p><b><span style="FONT-SIZE: 11pt; FONT-FAMILY: "Calibri","sans-serif"; COLOR: #58595B"></p>
</span>
<p style="MARGIN-BOTTOM: 6pt; MARGIN-TOP: 6pt"><span style="FONT-SIZE: 8pt; COLOR: #58595B; BACKGROUND-COLOR: #ffffff">Registered in England. No 04760864. Registered office as above</span></p>
<p style="MARGIN-BOTTOM: 0pt; MARGIN-TOP: 0pt"><span style="FONT-SIZE: 8pt; COLOR: #58595B; BACKGROUND-COLOR: #ffffff">The information transmitted is intended only for the person or entity to which it is addressed and may contain confidential and/or privileged
 material. Any review, retransmission, dissemination or other use of, or taking of any action in reliance upon, this information by persons or entities other than the intended recipient is prohibited.
<br>
If you received this in error, please contact the sender and delete the material from any computer.</span></p>
</b>
</body>
</html>