<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Making some progress with Pacemaker/DRBD, but still trying to grasp some of the basics of this framework. Here is my current situation:<div><br></div><div>I have a two-node cluster, pmk1 and pmk2, with resources ClusterIP and DrbdFS. In what follows, commands preceded by '[pmk1] #' are to be understood as commands issued by the superuser in pmk1, whereas those preceded by '[pmk2] #' are issued by the superuser in pmk2 (pretty obvious, but better make it crystal clear).</div><div><br></div><div>[pmk1] # pcs status resources</div><div> ClusterIP<span style="white-space:pre">   </span>(ocf::heartbeat:IPaddr2):<span style="white-space:pre">    </span>Started pmk1</div><div> Master/Slave Set: DrbdDataClone [DrbdData]</div><div>     Masters: [ pmk1 ]</div><div>     Slaves: [ pmk2 ]</div><div> DrbdFS<span style="white-space:pre">        </span>(ocf::heartbeat:Filesystem):<span style="white-space:pre"> </span>Started pmk1</div><div><br></div><div>[pmk2] # pcs status resources</div><div> ClusterIP<span style="white-space:pre">  </span>(ocf::heartbeat:IPaddr2):<span style="white-space:pre">    </span>Started pmk1</div><div> Master/Slave Set: DrbdDataClone [DrbdData]</div><div>     Masters: [ pmk1 ]</div><div>     Slaves: [ pmk2 ]</div><div> DrbdFS<span style="white-space:pre">        </span>(ocf::heartbeat:Filesystem):<span style="white-space:pre"> </span>Started pmk2</div><div><br></div><div>There is an ext4 filesystem in the DRBD device, mounted at /var/lib/pmk. When things are as described above, in pmk1 this directory contains the data that I used when I populated the DRBD filesystem  in pmk1, whereas in pmk2 it contains nothing. I.e. everything is as expected.</div><div><br></div><div>Then I did</div><div><br></div><div>[pmk1] # pcs cluster stop pmk1</div><div><div>pmk1: Stopping Cluster (pacemaker)...</div><div>pmk1: Stopping Cluster (corosync)...</div></div><div><br></div><div><div>[pmk2] # pcs status resources</div><div> ClusterIP<span style="white-space:pre">   </span>(ocf::heartbeat:IPaddr2):<span style="white-space:pre">    </span>Started pmk2</div><div> Master/Slave Set: DrbdDataClone [DrbdData]</div><div>     Masters: [ pmk2 ]</div><div>     Stopped: [ pmk2 ]</div><div> DrbdFS<span style="white-space:pre">       </span>(ocf::heartbeat:Filesystem):<span style="white-space:pre"> </span>Started pmk2</div></div><div><br></div><div>After this the contents of /var/lib/pmk in pmk2 are those that were used to populated the DRBD filesystem in pmk1 (plus any changes introduced by pmk1 before I stopped it), whereas /var/lib/pmk in pmk1 is now empty. Which implies that things seem to be behaving OK - or, at least, the way I was expecting for them to behave.</div><div><br></div><div>Next I tried to bring pmk1 back on:</div><div><br></div><div>[pmk1] # pcs cluster start pmk1</div><div><div>pmk1: Starting Cluster (corosync)...</div><div>pmk1: Starting Cluster (pacemaker)...</div></div><div><br></div><div>[pmk1] # pcs status resources</div><div><div>ClusterIP<span style="white-space:pre"> </span>(ocf::heartbeat:IPaddr2):<span style="white-space:pre">    </span>Stopped</div><div> Master/Slave Set: DrbdDataClone [DrbdData]</div><div>     Stopped: [ pmk1 pmk2 ]</div><div> DrbdFS<span style="white-space:pre">       </span>(ocf::heartbeat:Filesystem):<span style="white-space:pre"> </span>Stopped</div></div><div><br></div><div>[pmk2] # pcs status resources</div><div> ClusterIP<span style="white-space:pre">   </span>(ocf::heartbeat:IPaddr2):<span style="white-space:pre">    </span>Started pmk2</div><div> Master/Slave Set: DrbdDataClone [DrbdData]</div><div>     Masters: [ pmk2 ]</div><div>     Stopped: [ pmk2 ]</div><div> DrbdFS<span style="white-space:pre">       </span>(ocf::heartbeat:Filesystem):<span style="white-space:pre"> </span>Started pmk2</div><div><br></div><div>Node pmk1 is back up, but ClusterIP and DrbdFS are not, at least on pmk1. And pmk2 remains in charge. I clumsily tried to restart those resources by hand in pmk1, to no avail:</div><div><br></div><div>[pmk1] # pcs resource restart ClusterIP</div><div>Error: Error performing operation: No such device or address</div><div>ClusterIP is not running anywhere and so cannot be restarted</div><div><br></div><div>I also tried stopping and starting the pmk1 node from pmk1, and also from pmk2, several times, to no avail.</div><div><br></div><div>How can I bring back the pmk1 node on correctly, so that everything is how it originally was - i.e. with pmk1 up and running, and with the resources also up and running in pmk1?</div><div><br></div><div><br></div><div><br></div><div><br></div></div></div></div></div></div></div></div></div></div>