<p>Try to set expected-quorum-votes to 1. I'm not sure but in my opinion that is the problem.</p>
<div class="gmail_quote">Il giorno 14/feb/2012 06:43, "âÏÇÏÍÏÌÏ× äÍÉÔÒÉÊ ÷ÉËÔÏÒÏ×ÉÞ" <<a href="mailto:beatseed@mail.ru">beatseed@mail.ru</a>> ha scritto:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi,<br>
I have a trouble with my test configuration.<br>
I build an Actice/Active cluster Ubuntu(11.10)+DRBD+Cman+Pacemaker+gfs2+Xen for test purpose.<br>
Now i am doing some tests with availability. I am try to start šcluster on one node.<br>
<br>
Trouble is - the Filesystem primitive ClusterFS (fs type=gfs2) does not start when one of two nodes is switched off.<br>
<br>
Here my configuration:<br>
<br>
node blaster \<br>
 š š š šattributes standby="off"<br>
node turrel \<br>
 š š š šattributes standby="off"<br>
primitive ClusterData ocf:linbit:drbd \<br>
 š š š šparams drbd_resource="clusterdata" \<br>
 š š š šop monitor interval="60s"<br>
primitive ClusterFS ocf:heartbeat:Filesystem \<br>
 š š š šparams device="/dev/drbd/by-res/clusterdata" directory="/mnt/cluster" fstype="gfs2" \<br>
 š š š šop start interval="0" timeout="60s" \<br>
 š š š šop stop interval="0" timeout="60s" \<br>
 š š š šop monitor interval="60s" timeout="60s"<br>
primitive ClusterIP ocf:heartbeat:IPaddr2 \<br>
 š š š šparams ip="192.168.122.252" cidr_netmask="32" clusterip_hash="sourceip" \<br>
 š š š šop monitor interval="30s"<br>
primitive SSH-stonith stonith:ssh \<br>
 š š š šparams hostlist="turrel blaster" \<br>
 š š š šop monitor interval="60s"<br>
primitive XenDom ocf:heartbeat:Xen \<br>
 š š š šparams xmfile="/etc/xen/xen1.example.com.cfg" \<br>
 š š š šmeta allow-migrate="true" is-managed="true" target-role="Stopped" \<br>
 š š š šutilization cores="1" mem="512" \<br>
 š š š šop monitor interval="30s" timeout="30s" \<br>
 š š š šop start interval="0" timeout="90s" \<br>
 š š š šop stop interval="0" timeout="300s"<br>
ms ClusterDataClone ClusterData \<br>
 š š š šmeta master-max="2" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"<br>
clone ClusterFSClone ClusterFS \<br>
 š š š šmeta target-role="Started" is-managed="true"<br>
clone IP ClusterIP \<br>
 š š š šmeta globally-unique="true" clone-max="2" clone-node-max="2"<br>
clone SSH-stonithClone SSH-stonith<br>
location prefere-blaster XenDom 50: blaster<br>
colocation XenDom-with-ClusterFS inf: XenDom ClusterFSClone<br>
colocation fs_on_drbd inf: ClusterFSClone ClusterDataClone:Master<br>
order ClusterFS-after-ClusterData inf: ClusterDataClone:promote ClusterFSClone:start<br>
order XenDom-after-ClusterFS inf: ClusterFSClone XenDom<br>
property $id="cib-bootstrap-options" \<br>
 š š š šdc-version="1.1.5-01e86afaaa6d4a8c4836f68df80ababd6ca3902f" \<br>
 š š š šcluster-infrastructure="cman" \<br>
 š š š šexpected-quorum-votes="2" \<br>
 š š š šstonith-enabled="true" \<br>
 š š š šno-quorum-policy="ignore" \<br>
 š š š šlast-lrm-refresh="1329194925"<br>
rsc_defaults $id="rsc-options" \<br>
 š š š šresource-stickiness="100"<br>
<br>
Here is an $crm resource show:<br>
<br>
Master/Slave Set: ClusterDataClone [ClusterData]<br>
 š š Masters: [ turrel ]<br>
 š š Stopped: [ ClusterData:1 ]<br>
šClone Set: IP [ClusterIP] (unique)<br>
 š š ClusterIP:0 š š š š(ocf::heartbeat:IPaddr2) Started<br>
 š š ClusterIP:1 š š š š(ocf::heartbeat:IPaddr2) Started<br>
šClone Set: ClusterFSClone [ClusterFS]<br>
 š š Stopped: [ ClusterFS:0 ClusterFS:1 ]<br>
šClone Set: SSH-stonithClone [SSH-stonith]<br>
 š š Started: [ turrel ]<br>
 š š Stopped: [ SSH-stonith:1 ]<br>
šXenDom (ocf::heartbeat:Xen) Stopped<br>
<br>
I tryed:<br>
crm(live)resource# cleanup ClusterFSClone<br>
Cleaning up ClusterFS:0 on turrel<br>
Cleaning up ClusterFS:1 on turrel<br>
Waiting for 3 replies from the CRMd... OK<br>
<br>
I can see only warn message in /var/log/cluster/corosync.log<br>
Feb 14 16:25:56 turrel pengine: [1640]: WARN: unpack_rsc_op: Processing failed op ClusterFS:0_start_0 on turrel: unknown exec error (-2)<br>
and<br>
Feb 14 16:25:56 turrel pengine: [1640]: WARN: common_apply_stickiness: Forcing ClusterFSClone away from turrel after 1000000 failures (max=1000000)<br>
Feb 14 16:25:56 turrel pengine: [1640]: WARN: common_apply_stickiness: Forcing ClusterFSClone away from turrel after 1000000 failures (max=1000000)<br>
<br>
Direct me, please, what i need to check or else?<br>
<br>
Best regards,<br>
Dmitriy Bogomolov<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</blockquote></div>