<html><body><p>Correction... <br><br>When I stopped pacemaker/corosync on the four (powered on / active) cluster node hosts,  I was having an issue with<br>the gentle method of stopping the cluster (pcs cluster stop --all), so I ended up doing individual (pcs cluster kill <cluster_node>)<br>on each of the four cluster nodes.   I then had to stop the virtual domains manually via 'virsh destroy <guestname>' on each host.<br>Perhaps there was some residual node status affecting my quorum?   <br><br>Thanks...<br><br>Scott Greenlese ... IBM Solutions Test,  Poughkeepsie, N.Y.<br>  INTERNET:  swgreenl@us.ibm.com  <br>  PHONE:  8/293-7301 (845-433-7301)    M/S:  POK 42HA/P966<br><br><br><img width="16" height="16" src="cid:1__=8FBB0ABBDFDDC4378f9e8a93df938690918c8FB@" border="0" alt="Inactive hide details for Scott Greenlese---09/08/2016 10:01:17 AM---Hi all... I have a few very basic questions for the group."><font color="#424282">Scott Greenlese---09/08/2016 10:01:17 AM---Hi all... I have a few very basic questions for the group.</font><br><br><font size="2" color="#5F5F5F">From:        </font><font size="2">Scott Greenlese/Poughkeepsie/IBM@IBMUS</font><br><font size="2" color="#5F5F5F">To:        </font><font size="2">users@clusterlabs.org</font><br><font size="2" color="#5F5F5F">Cc:        </font><font size="2">Si Bo Niu <niusibo@cn.ibm.com>, Scott Loveland/Poughkeepsie/IBM@IBMUS, Michael Tebolt/Poughkeepsie/IBM@IBMUS</font><br><font size="2" color="#5F5F5F">Date:        </font><font size="2">09/08/2016 10:01 AM</font><br><font size="2" color="#5F5F5F">Subject:        </font><font size="2">[ClusterLabs] Pacemaker quorum behavior</font><br><hr width="100%" size="2" align="left" noshade style="color:#8091A5; "><br><br><br><font size="4">Hi all... <br><br>I have a few very basic questions for the group.<br><br>I have a 5 node (Linux on Z LPARs) pacemaker cluster with 100 VirtualDomain pacemaker-remote nodes<br>plus 100 "opaque" VirtualDomain resources. The cluster is configured to be 'symmetric' and I have no<br>location constraints on the 200 VirtualDomain resources (other than to prevent the opaque guests<br>from running on the pacemaker remote node resources). My quorum is set as: <br><br>quorum {<br>provider: corosync_votequorum<br>}<br><br>As an experiment, I powered down one LPAR in the cluster, leaving 4 powered up with the pcsd service up on the 4 survivors <br>but corosync/pacemaker down (pcs cluster stop --all) on the 4 survivors. I then started pacemaker/corosync on a single cluster<br>node (pcs cluster start), and this resulted in the 200 VirtualDomain resources activating on the single node. <br>This was not what I was expecting. I assumed that no resources would activate / start on any cluster nodes<br>until 3 out of the 5 total cluster nodes had pacemaker/corosync running. <br><br>After starting pacemaker/corosync on the single host (zs95kjpcs1), this is what I see : <br><br>[root@zs95kj VD]# date;pcs status |less<br>Wed Sep 7 15:51:17 EDT 2016<br>Cluster name: test_cluster_2<br>Last updated: Wed Sep 7 15:51:18 2016 Last change: Wed Sep 7 15:30:12 2016 by hacluster via crmd on zs93kjpcs1<br>Stack: corosync<br>Current DC: zs95kjpcs1 (version 1.1.13-10.el7_2.ibm.1-44eb2dd) - partition with quorum<br>106 nodes and 304 resources configured<br></font><font size="4" color="#FF0000"><br>Node zs93KLpcs1: pending<br>Node zs93kjpcs1: pending<br>Node zs95KLpcs1: pending</font><font size="4" color="#008000"><br>Online: [ zs95kjpcs1 ]</font><font size="4"><br>OFFLINE: [ zs90kppcs1 ]<br><br>.<br>.<br>.<br>PCSD Status:</font><font size="4" color="#008000"><br>zs93kjpcs1: Online<br>zs95kjpcs1: Online<br>zs95KLpcs1: Online</font><font size="4" color="#FF0000"><br>zs90kppcs1: Offline</font><font size="4" color="#008000"><br>zs93KLpcs1: Online</font><font size="4"><br><br>So, what exactly constitutes an "Online" vs. "Offline" cluster node w.r.t. quorum calculation? Seems like in my case, it's "pending" on 3 nodes, <br>so where does that fall? Any why "pending"? What does that mean? <br><br>Also, what exactly is the cluster's expected reaction to quorum loss? Cluster resources will be stopped or something else?<br><br>Where can I find this documentation? <br><br>Thanks!<br><br>Scott Greenlese - IBM Solution Test Team. <br><br><br><br>Scott Greenlese ... IBM Solutions Test, Poughkeepsie, N.Y.<br>INTERNET: swgreenl@us.ibm.com <br>PHONE: 8/293-7301 (845-433-7301) M/S: POK 42HA/P966<br></font><tt>_______________________________________________<br>Users mailing list: Users@clusterlabs.org<br></tt><tt><a href="http://clusterlabs.org/mailman/listinfo/users">http://clusterlabs.org/mailman/listinfo/users</a></tt><tt><br><br>Project Home: </tt><tt><a href="http://www.clusterlabs.org">http://www.clusterlabs.org</a></tt><tt><br>Getting started: </tt><tt><a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a></tt><tt><br>Bugs: </tt><tt><a href="http://bugs.clusterlabs.org">http://bugs.clusterlabs.org</a></tt><tt><br></tt><br><br><BR>
</body></html>