<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Arial; font-size: 10pt; color: #000000'>Hi,<br><br>I built a test cluster with 2 nodes.<br>Ubuntu 10.4.3 LTS with <strong style="font-weight: normal;">ppa:ubuntu-ha-maintainers/ppa</strong><br><br>corosync
              
              
                1.4.2<br>pacemaker
              
              
                1.1.6<br><br>primitive clvm ocf:lvm2:clvmd \<br>        params daemon_timeout="30" \<br>        operations $id="clvm-operations" \<br>        op start interval="0" timeout="90" \<br>        op stop interval="0" timeout="100" \<br>        op monitor interval="0" timeout="20" start-delay="0" \<br>        meta target-role="started"<br>primitive data ocf:heartbeat:LVM \<br>        params volgrpname="data" \<br>        operations $id="data-operations" \<br>        op start interval="0" timeout="30" \<br>        op stop interval="0" timeout="30" \<br>        op monitor interval="10" timeout="120" start-delay="0" \<br>        op methods interval="0" timeout="5" \<br>        meta target-role="started"<br>primitive dlm ocf:pacemaker:controld \<br>        operations $id="dlm-operations" \<br>        op start interval="0" timeout="90" \<br>        op stop interval="0" timeout="100" \<br>        op monitor interval="10" timeout="20" start-delay="0" \<br>        meta target-role="started"<br>primitive fs ocf:heartbeat:Filesystem \<br>        params device="/dev/data/test" directory="/data/test" fstype="ocfs2" \<br>        operations $id="fs-operations" \<br>        op start interval="0" timeout="60" \<br>        op stop interval="0" timeout="60" \<br>        op monitor interval="120" timeout="40" start-delay="0" \<br>        op notify interval="0" timeout="60" \<br>        meta target-role="started"<br>primitive o2cb ocf:pacemaker:o2cb \<br>        operations $id="o2cb-operations" \<br>        op start interval="0" timeout="90" \<br>        op stop interval="0" timeout="100" \<br>        op monitor interval="0" timeout="20" start-delay="0" \<br>        meta target-role="started"<br>primitive res_DRBD ocf:linbit:drbd \<br>        params drbd_resource="r0" \<br>        operations $id="res_DRBD-operations" \<br>        op start interval="0" timeout="240" \<br>        op promote interval="0" timeout="90" \<br>        op demote interval="0" timeout="90" \<br>        op stop interval="0" timeout="100" \<br>        op monitor interval="30" timeout="20" start-delay="1min" \<br>        op notify interval="0" timeout="90" \<br>        meta target-role="started"<br>group dlm-clvm dlm clvm<br>ms ms_DRBD res_DRBD \<br>        meta master-max="2" clone-max="2" notify="true" interleave="true"<br>clone clone_data data \<br>        meta clone-max="2" ordered="true" interleave="true"<br>clone dlm-clvm-clone dlm-clvm \<br>        meta interleave="true" ordered="true"<br>clone fs-clone fs \<br>        meta clone-max="2" ordered="true" interleave="true"<br>clone o2cb-clone o2cb \<br>        meta clone-max="2" interleave="true"<br>colocation col_data_clvm-dlm-clone inf: clone_data dlm-clvm-clone<br>colocation col_fs_o2cb inf: fs-clone o2cb-clone<br>colocation col_ms_DRBD_dlm-clvm-clone inf: dlm-clvm-clone ms_DRBD:Master<br>colocation col_o2cb_dlm-clvm inf: o2cb-clone dlm-clvm-clone<br>order ord_data_after_clvm-dlm-clone inf: dlm-clvm-clone clone_data<br>order ord_ms_DRBD_dlm-clvm-clone inf: ms_DRBD:promote dlm-clvm-clone:start<br>order ord_o2cb_after_dlm-clvm 0: dlm-clvm-clone o2cb-clone<br>order ord_o2cb_fs inf: o2cb-clone fs-clone<br>property $id="cib-bootstrap-options" \<br>        dc-version="1.1.6-9971ebba4494012a93c03b40a2c58ec0eb60f50c" \<br>        cluster-infrastructure="openais" \<br>        expected-quorum-votes="2" \<br>        stonith-enabled="false" \<br>        no-quorum-policy="ignore" \<br>        last-lrm-refresh="1323246238" \<br>        default-resource-stickiness="1000"<br><br>The problem is to restart corosync or to reboot a cluster node. All resources are stopped except for drbd resource. Than the system hangs for a long time. <br>corosync.log:<br><br>ubuntu0 crmd: [926]: info: do_state_transition: (Re)Issuing shutdown request now that we are the DC<br>ubuntu0 crmd: [926]: info: do_state_transition: Starting PEngine Recheck Timer<br>ubuntu0 crmd: [926]: info: do_shutdown_req: Sending shutdown request to DC: ubuntu0<br>ubuntu0 crmd: [926]: info: handle_shutdown_request: Creating shutdown request for ubuntu0 (state=S_IDLE)<br>corosync [pcmk  ] notice: pcmk_shutdown: Still waiting for crmd (pid=926, seq=6) to terminate...<br>corosync [pcmk  ] notice: pcmk_shutdown: Still waiting for crmd (pid=926, seq=6) to terminate...<br>corosync [pcmk  ] notice: pcmk_shutdown: Still waiting for crmd (pid=926, seq=6) to terminate...<br>corosync [pcmk  ] notice: pcmk_shutdown: Still waiting for crmd (pid=926, seq=6) to terminate...<br>corosync [pcmk  ] notice: pcmk_shutdown: Still waiting for crmd (pid=926, seq=6) to terminate...<br><br>I tested the same config with a debian 6.0.3. The reboot works. The behaviour there is, that  in the first step the drbd resource demote to secondary and then goes down.<br><br>Is this a known problem??<br><br>Thank you for help.<br><br>Regards,<br>Erik  <br><br><div><br></div></div></body></html>