i build pacemaker from latest source and problem gone<br><br><div class="gmail_quote">2010/12/6 Dejan Muhamedagic <span dir="ltr"><<a href="mailto:dejanmm@fastmail.fm">dejanmm@fastmail.fm</a>></span><br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
Hi,<br>
<div><div></div><div class="h5"><br>
On Mon, Dec 06, 2010 at 03:11:03PM +0300, ruslan usifov wrote:<br>
> hello<br>
><br>
> I run pacemaker on ubuntu (Ubuntu 10.04.1 LTS) with corosync, i installed it<br>
> from apt, and my pacemaker version is:<br>
><br>
> root@storage0:/var/log# dpkg -l | grep 'pacemaker'<br>
> ii  pacemaker                           1.0.8+hg15494-2ubuntu2          HA<br>
> cluster resource manager<br>
><br>
><br>
> and have follow problem with pacemaker, with follow configration:<br>
> root@storage0:/var/log# crm configure show<br>
> node storage0<br>
> node storage1<br>
> primitive drbd_web ocf:linbit:drbd \<br>
>         params drbd_resource="web" \<br>
>         op monitor interval="10s" timeout="60s"<br>
> primitive iscsi_ip ocf:heartbeat:IPaddr2 \<br>
>         params ip="192.168.17.19" nic="eth1:1" cidr_netmask="24" \<br>
>         op monitor interval="10s" \<br>
>         meta target-role="Started"<br>
> primitive iscsi_web_target ocf:heartbeat:iSCSITarget \<br>
>         params iqn="iqn.2010-06.playrix.local:san.web" implementation="iet"<br>
> \<br>
>         op monitor interval="10s" timeout="30s" depth="0" \<br>
>         meta target-role="Started"<br>
> primitive iscsi_web_target_lun1 ocf:heartbeat:iSCSILogicalUnit \<br>
>         params lun="1" path="/dev/drbd1"<br>
> target_iqn="iqn.2010-06.playrix.local:san.web" implementation="iet" \<br>
>         op monitor interval="10s" timeout="30s"<br>
> group iscsi iscsi_ip iscsi_web_target iscsi_web_target_lun1<br>
> ms ms_drbd_web drbd_web \<br>
>         meta master-max="1" master-node-max="1" clone-max="2"<br>
> clone-node-max="1" notify="true"<br>
> colocation iscsi_on_drbd inf: ms_drbd_web:Master iscsi<br>
> order iscsi_target_after_drbd inf: ms_drbd_web:promote iscsi_web_target<br>
> order iscsi_target_lun_after_iscsi_target inf: iscsi_web_target<br>
> iscsi_web_target_lun1<br>
> property $id="cib-bootstrap-options" \<br>
>         dc-version="1.0.8-042548a451fce8400660f6031f4da6f0223dd5dd" \<br>
>         cluster-infrastructure="openais" \<br>
>         expected-quorum-votes="2" \<br>
>         stonith-enabled="false" \<br>
>         no-quorum-policy="ignore"<br>
> rsc_defaults $id="rsc-options" \<br>
>         resource-stickiness="100"<br>
><br>
><br>
> When i shutdown node storage1, node storage0 doesn't  accept Master drbd<br>
> role, so output from crm_mon -1 lokks like this:<br>
> ============<br>
> Last updated: Mon Dec  6 15:04:18 2010<br>
> Stack: openais<br>
> Current DC: storage0 - partition WITHOUT quorum<br>
> Version: 1.0.8-042548a451fce8400660f6031f4da6f0223dd5dd<br>
> 2 Nodes configured, 2 expected votes<br>
> 2 Resources configured.<br>
> ============<br>
><br>
> Online: [ storage0 ]<br>
> OFFLINE: [ storage1 ]<br>
><br>
>  Master/Slave Set: ms_drbd_web<br>
>      Slaves: [ storage0 ]<br>
>      Stopped: [ drbd_web:1 ]<br>
>  Resource Group: iscsi<br>
>      iscsi_ip   (ocf::heartbeat:IPaddr2):       Started storage0<br>
>      iscsi_web_target   (ocf::heartbeat:iSCSITarget):   Started storage0<br>
>      iscsi_web_target_lun1      (ocf::heartbeat:iSCSILogicalUnit):<br>
> Started storage0 FAILED<br>
><br>
> Failed actions:<br>
>     iscsi_web_target_lun1_start_0 (node=storage0, call=91, rc=1,<br>
> status=complete): unknown error<br>
><br>
><br>
> and when try to promote node got folow error:<br>
> crm(live)resource# promote ms_drbd_web<br>
> Error performing operation: Remote node did not respond<br>
><br>
><br>
> and periodicaly in /var/log/messages, i see folow error:<br>
> Dec  6 14:49:35 storage0 kernel: [ 5048.618562] pengine[8584]: segfault at 8<br>
> ip b76ad094 sp bf8261d0 error 4 in libpengine.so.3.0.0[b76a2000+32000]<br>
> Dec  6 14:50:37 storage0 kernel: [ 5111.505491] pengine[8681]: segfault at 0<br>
> ip b7831ef3 sp bfd28b30 error 4 in libpengine.so.3.0.0[b7821000+32000]<br>
> Dec  6 14:51:41 storage0 kernel: [ 5174.746349] pengine[8770]: segfault at 8<br>
> ip b7751094 sp bfe1ccb0 error 4 in libpengine.so.3.0.0[b7746000+32000]<br>
><br>
><br>
><br>
> Why pacemacker doesn't switch role of live node to master? And why segfault<br>
> happens?<br>
<br>
</div></div>Looks like you ran into problems because of segfaults. I suspect<br>
that the segfault has been fixed in the meantime, but hard to<br>
say unless you show the backtrace. Best to open a bugzilla with<br>
your vendor.<br>
<br>
Thanks,<br>
<br>
Dejan<br>
<br>
<br>
> Please help<br>
<br>
> _______________________________________________<br>
> Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
> <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
><br>
> Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>
<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker" target="_blank">http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</a><br>
</blockquote></div><br>