<div>Hi folks,</div><div>I'm running a 2 node cluster with pacemaker, DRBD dual primary, ocfs2.</div><div>Now I'm trying to setup stonith correctly, but my stonith resources don't start. I did some research but I didn't find a solution to my problem.</div>

<div><br></div><div>This is my cib:</div><div><br></div><div>node server1</div><div>node server2</div><div>primitive DLM ocf:pacemaker:controld \</div><div><span style="white-space:pre">    </span>op monitor interval="120s"</div>

<div>primitive DRBD ocf:linbit:drbd \</div><div><span style="white-space:pre">        </span>params drbd_resource="r0" \</div><div><span style="white-space:pre"> </span>operations $id="DRBD-operations" \</div>

<div><span style="white-space:pre">       </span>op monitor interval="20" role="Master" timeout="20" \</div><div><span style="white-space:pre">   </span>op monitor interval="30" role="Slave" timeout="20"</div>

<div>primitive FS ocf:heartbeat:Filesystem \</div><div><span style="white-space:pre"> </span>params device="/dev/drbd1" directory="/drbd" fstype="ocfs2" \</div><div><span style="white-space:pre">   </span>op monitor interval="120s" \</div>

<div><span style="white-space:pre">       </span>meta target-role="Started"</div><div>primitive O2CB ocf:pacemaker:o2cb \</div><div><span style="white-space:pre">        </span>op monitor interval="120s"</div>
<div>primitive STONITH1 stonith:external/ipmi \</div><div><span style="white-space:pre">      </span>params hostname="server1" ipaddr="10.0.0.1" userid="user" passwd="user" interface="lan" \</div>

<div><span style="white-space:pre">       </span>meta target-role="Started"</div><div>primitive STONITH2 stonith:external/ipmi \</div><div><span style="white-space:pre"> </span>params hostname="server2" ipaddr="10.0.0.2" userid="user" passwd="user" interface="lan" \</div>

<div><span style="white-space:pre">       </span>meta target-role="Started"</div><div>ms ms-DRBD DRBD \</div><div><span style="white-space:pre">  </span>meta resource-stickines="100" notify="true" master-max="2" interleave="true" target-role="Stopped"</div>

<div>clone cloneDLM DLM \</div><div><span style="white-space:pre">    </span>meta globally-unique="false" interleave="true" target-role="Started"</div><div>clone cloneFS FS \</div>
<div><span style="white-space:pre">       </span>meta interleave="true" ordered="true"</div><div>clone cloneO2CB O2CB \</div><div><span style="white-space:pre">        </span>meta globally-unique="false" interleave="true" target-role="Started"</div>

<div>location loc-stonith1 STONITH1 -inf: server1</div><div>location loc-stonith2 STONITH2 -inf: server2</div><div>colocation DLM-DRBD inf: cloneDLM ms-DRBD:Master</div><div>colocation FS-O2CB inf: cloneFS cloneO2CB</div>

<div>colocation O2CB-DLM inf: cloneO2CB cloneDLM</div><div>order DLM-before-O2CB inf: cloneDLM:start cloneO2CB:start</div><div>order DRBD-before-DLM inf: ms-DRBD:promote cloneDLM:start</div><div>order O2CB-before-FS inf: cloneO2CB:start cloneFS:start</div>

<div>property $id="cib-bootstrap-options" \</div><div><span style="white-space:pre">        </span>dc-version="1.0.8-042548a451fce8400660f6031f4da6f0223dd5dd" \</div><div><span style="white-space:pre">       </span>cluster-infrastructure="openais" \</div>

<div><span style="white-space:pre">       </span>expected-quorum-votes="2" \</div><div><span style="white-space:pre"> </span>no-quorum-policy="ignore" \</div><div>
<span style="white-space:pre">  </span>stonith-enabled="true" \</div><div><span style="white-space:pre">    </span>stonith-action="poweroff" \</div><div><span style="white-space:pre"> </span>default-resource-stickiness="1000"</div>

<div><br></div><div><br></div><div>Is there something wrong?</div><div>-----------------------------------</div><div><br></div><div>crm_mon -n:</div><div><br></div><div>Last updated: Wed May 26 00:04:53 2010</div><div>Stack: openais</div>

<div>Current DC: server1 - partition with quorum</div><div>Version: 1.0.8-042548a451fce8400660f6031f4da6f0223dd5dd</div><div>2 Nodes configured, 2 expected votes</div><div>6 Resources configured.</div><div>============</div>

<div><br></div><div>Node server2: online</div><div> <span style="white-space:pre">  </span>DLM:0   (ocf::pacemaker:controld) Started </div><div><span style="white-space:pre">    </span>O2CB:0  (ocf::pacemaker:o2cb) Started</div>

<div><span style="white-space:pre">       </span>FS:0    (ocf::heartbeat:Filesystem) Started</div><div><span style="white-space:pre">   </span>DRBD:0  (ocf::linbit:drbd) Master</div><div>
Node server1: online</div><div> <span style="white-space:pre">      </span>DRBD:1  (ocf::linbit:drbd) Master </div><div><span style="white-space:pre">    </span>DLM:1   (ocf::pacemaker:controld) Started </div>
<div><span style="white-space:pre">       </span>O2CB:1  (ocf::pacemaker:o2cb) Started </div><div><span style="white-space:pre">        </span>FS:1    (ocf::heartbeat:Filesystem) Started</div>
<div><br></div><div>Failed actions:</div><div>   STONITH2_start_0 (node=server1, call=8, rc=1, status=complete): unknown erro r</div><div>     STONITH1_start_0 (node=server2, call=8, rc=1, status=complete): unknown erro r</div>

<div><br></div><div>------------------------</div><div><br></div><div>crm_verify -L -V:</div><div><br></div><div>crm_verify[5695]: 2010/05/26_00:17:19 WARN: unpack_rsc_op: Processing failed op STONITH2_start_0 on server1: unknown error(1)</div>

<div>crm_verify[5695]: 2010/05/26_00:17:19 WARN: unpack_rsc_op: Processing failed op STONITH1_start_0 on server2: unknown error(1)</div><div>crm_verify[5695]: 2010/05/26_00:17:19 WARN: common_apply_stickiness: Forcing STONITH1 away from server2 after 1000000 failures (max=1000000)</div>

<div>crm_verify[5695]: 2010/05/26_00:17:19 WARN: common_apply_stickiness: Forcing STONITH2 away from server1 after 1000000 failures (max=1000000)</div><div><br></div><div><br></div><div>I hope someone can help me,</div><div>

Thank you!</div><div><br></div><div>Matt</div>