<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.EmailStyle18
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">I figured out the cause. CMAN got installed by yum, and so none of my changes to corosync.conf had any effect, including the udpu directive. Now I just have to figure out how to enable unicast in cman.
<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal"><span style="color:#1F497D">--<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">Eric Robinson<o:p></o:p></span></p>
<p class="MsoNormal"><span style="color:#1F497D">   <o:p></o:p></span></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt">
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b>From:</b> Eric Robinson [mailto:eric.robinson@psmnv.com] <br>
<b>Sent:</b> Wednesday, August 23, 2017 3:16 PM<br>
<b>To:</b> Cluster Labs - All topics related to open-source clustering welcomed <users@clusterlabs.org><br>
<b>Subject:</b> [ClusterLabs] Is there a Trick to Making Corosync Work on Microsoft Azure?<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I created two nodes on Micrsoft Azure, but I can’t get them to join a cluster. Any thoughts?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">OS: RHEL 6.9<o:p></o:p></p>
<p class="MsoNormal">Corosync version: 1.4.7-5.el6.x86_64<o:p></o:p></p>
<p class="MsoNormal">Node names: ha001a (172.28.0.4/23), ha001b (172.28.0.5/23)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The nodes are on the same subnet and can ping and ssh to each other just fine by either host name or IP address.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have configured corosync to use unicast.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">corosync-cfgtool looks fine…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">[root@ha001b corosync]# corosync-cfgtool -s<o:p></o:p></p>
<p class="MsoNormal">Printing ring status.<o:p></o:p></p>
<p class="MsoNormal">Local node ID 2<o:p></o:p></p>
<p class="MsoNormal">RING ID 0<o:p></o:p></p>
<p class="MsoNormal">        id      = 172.28.0.5<o:p></o:p></p>
<p class="MsoNormal">        status  = ring 0 active with no faults<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">…but corosync-objctl only shows the local node…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">[root@ha001b corosync]# corosync-objctl |grep join<o:p></o:p></p>
<p class="MsoNormal">totem.join=60<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.memb_join_tx=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.memb_join_rx=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.members.2.join_count=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.members.2.status=joined<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">…pcs status shows…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Cluster name: ha001<o:p></o:p></p>
<p class="MsoNormal">Stack: cman<o:p></o:p></p>
<p class="MsoNormal">Current DC: ha001b (version 1.1.15-5.el6-e174ec8) - partition with quorum<o:p></o:p></p>
<p class="MsoNormal">Last updated: Wed Aug 23 18:04:33 2017          Last change: Wed Aug 23 17:51:07 2017 by root via cibadmin on ha001b<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">2 nodes and 0 resources configured<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Online: [ ha001b ]<o:p></o:p></p>
<p class="MsoNormal">OFFLINE: [ ha001a ]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">No resources<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Daemon Status:<o:p></o:p></p>
<p class="MsoNormal">  cman: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  corosync: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  pacemaker: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  pcsd: active/disabled<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">…it shows the opposite on the other node…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">[root@ha001a ~]# corosync-objctl |grep join<o:p></o:p></p>
<p class="MsoNormal">totem.join=60<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.memb_join_tx=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.memb_join_rx=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.members.1.join_count=1<o:p></o:p></p>
<p class="MsoNormal">runtime.totem.pg.mrp.srp.members.1.status=joined<o:p></o:p></p>
<p class="MsoNormal">[root@ha001a ~]# pcs status<o:p></o:p></p>
<p class="MsoNormal">Cluster name: ha001<o:p></o:p></p>
<p class="MsoNormal">Stack: cman<o:p></o:p></p>
<p class="MsoNormal">Current DC: ha001a (version 1.1.15-5.el6-e174ec8) - partition with quorum<o:p></o:p></p>
<p class="MsoNormal">Last updated: Wed Aug 23 18:06:04 2017          Last change: Wed Aug 23 17:51:03 2017 by root via cibadmin on ha001a<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">2 nodes and 0 resources configured<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Online: [ ha001a ]<o:p></o:p></p>
<p class="MsoNormal">OFFLINE: [ ha001b ]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">No resources<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Daemon Status:<o:p></o:p></p>
<p class="MsoNormal">  cman: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  corosync: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  pacemaker: active/disabled<o:p></o:p></p>
<p class="MsoNormal">  pcsd: active/disabled<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">…here is my corosync.conf…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">compatibility: whitetank<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">totem {<o:p></o:p></p>
<p class="MsoNormal">        version: 2<o:p></o:p></p>
<p class="MsoNormal">        secauth: off<o:p></o:p></p>
<p class="MsoNormal">        interface {<o:p></o:p></p>
<p class="MsoNormal">                member {<o:p></o:p></p>
<p class="MsoNormal">                        memberaddr: 172.28.0.4<o:p></o:p></p>
<p class="MsoNormal">                }<o:p></o:p></p>
<p class="MsoNormal">                member {<o:p></o:p></p>
<p class="MsoNormal">                        memberaddr: 172.28.0.5<o:p></o:p></p>
<p class="MsoNormal">                }<o:p></o:p></p>
<p class="MsoNormal">                ringnumber: 0<o:p></o:p></p>
<p class="MsoNormal">                bindnetaddr: 172.28.0.0<o:p></o:p></p>
<p class="MsoNormal">                mcastport: 5405<o:p></o:p></p>
<p class="MsoNormal">                ttl: 1<o:p></o:p></p>
<p class="MsoNormal">        }<o:p></o:p></p>
<p class="MsoNormal">        transport: udpu<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">logging {<o:p></o:p></p>
<p class="MsoNormal">        fileline: off<o:p></o:p></p>
<p class="MsoNormal">        to_logfile: yes<o:p></o:p></p>
<p class="MsoNormal">        to_syslog: yes<o:p></o:p></p>
<p class="MsoNormal">        logfile: /var/log/cluster/corosync.log<o:p></o:p></p>
<p class="MsoNormal">        debug: off<o:p></o:p></p>
<p class="MsoNormal">        timestamp: on<o:p></o:p></p>
<p class="MsoNormal">        logger_subsys {<o:p></o:p></p>
<p class="MsoNormal">                subsys: AMF<o:p></o:p></p>
<p class="MsoNormal">                debug: off<o:p></o:p></p>
<p class="MsoNormal">        }<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I used tcpdump and I see a lot of traffic between them on port 2224, but nothing else.  <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Is there an issue because the bindinetaddr is 172.28.0.0 but the members have a /23 mask?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">--<br>
Eric Robinson<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</div>
</body>
</html>