<html><body><p><font size="2">Hi,<br><br>I have been following the instructions on the following page to try and configure SBD fencing on my two-node cluster:<br></font><a href="https://documentation.suse.com/sle-ha/15-SP1/html/SLE-HA-all/cha-ha-storage-protect.html"><font size="2">https://documentation.suse.com/sle-ha/15-SP1/html/SLE-HA-all/cha-ha-storage-protect.html</font></a><font size="2"><br></font><br><font size="2">I am able to get through all the steps successfully, I am using the following device (/dev/sde1) as my shared disk:<br><br></font><font size="2" face="Courier New">Disk /dev/sde: 20 GiB, 21474836480 bytes, 41943040 sectors</font><br><font size="2" face="Courier New">Units: sectors of 1 * 512 = 512 bytes</font><br><font size="2" face="Courier New">Sector size (logical/physical): 512 bytes / 512 bytes</font><br><font size="2" face="Courier New">I/O size (minimum/optimal): 512 bytes / 512 bytes</font><br><font size="2" face="Courier New">Disklabel type: gpt</font><br><font size="2" face="Courier New">Disk identifier: 43987868-1C0B-41CE-8AF8-C522AB259655</font><br><br><font size="2" face="Courier New">Device     Start      End  Sectors Size Type</font><br><b><font size="2" face="Courier New">/dev/sde1</font></b><font size="2" face="Courier New">     48 41942991 41942944  20G IBM General Parallel Fs</font><br><br><font size="2">Since, I don't have a hardware watchdog at my disposal, I am using the software watchdog (softdog) instead. Having said this, I am able to get through all the steps successfully... I create the fence agent resource successfully, it shows as </font><b><font size="2">Started </font></b><font size="2">in </font><b><font size="2">crm status </font></b><font size="2">output</font><font size="2">:<br><br></font><font size="2" face="Courier New"> stonith_sbd        (stonith:fence_sbd):        Started ceha04</font><br><br><font size="2">The problem is when I run </font><b><font size="2">crm node fence ceha04 </font></b><font size="2">to test out fencing a host in my cluster. From the </font><b><font size="2">crm status</font></b><font size="2"> output, I see that the reboot action has failed and furthermore, in the system logs, I see the following messages:<br></font><font size="2" face="Courier New"><br>Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: notice: Requesting fencing (reboot) of node ceha04</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-fenced[24142]: notice: Client pacemaker-controld.24146.5ff1ac0c wants to fence (reboot) 'ceha04' with device '(any)'</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-fenced[24142]: notice: Requesting peer fencing (reboot) of ceha04</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-fenced[24142]: notice: Couldn't find anyone to fence (reboot) ceha04 with any device</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-fenced[24142]: error: Operation reboot of ceha04 by <no-one> for pacemaker-controld.24146@ceha04.1bad3987: No such device</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: notice: Stonith operation 3/1:4317:0:ec560474-96ea-4984-b801-400d11b5b3ae: No such device (-19)</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: notice: Stonith operation 3 for ceha04 failed (No such device): aborting transition.</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: warning: No devices found in cluster to fence ceha04, giving up</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: notice: Transition 4317 aborted: Stonith failed</font><br><font size="2" face="Courier New">Sep 21 14:12:33 ceha04 pacemaker-controld[24146]: notice: Peer ceha04 was not terminated (reboot) by <anyone> on behalf of pacemaker-controld.24146: No such device</font><br><br><font size="2">I don't know why Pacemaker isn't able to discover my fencing resource, why isn't it able to find anyone to fence the host from the cluster?<br><br>Any help is greatly appreciated. I can provide more details as required.</font><br><font size="2"><br>Thanks,</font><br><br><b><font size="2">Phil Stedman</font></b><br><font size="2">Db2 High Availability Development and Support<br>Email: pmstedma@us.ibm.com</font><BR>
</body></html>