<font size=2 face="sans-serif">i say thx to you, for trying to help me.
:)</font>
<br>
<br><font size=2 face="sans-serif">yes i checked it, there is no problem
with it, i assume it must be a problem with the ping or the attrd_updater,
because as I understand that, the crm gets an timeout from the monitor
process and then kills the ressource.</font>
<br>
<br><font size=2 face="sans-serif">"</font>
<br><font size=2 face="sans-serif">p_out=`$p_exe $p_args $OCF_RESKEY_options
$host 2>&1`; rc=$?</font>
<br>
<br><font size=2 face="sans-serif">        case
$rc in</font>
<br><font size=2 face="sans-serif">         
  0) active=`expr $active + 1`;;</font>
<br><font size=2 face="sans-serif">         
  1) ping_conditional_log warn "$host is inactive: $p_out";;</font>
<br><font size=2 face="sans-serif">         
  *) ocf_log err "Unexpected result for '$p_exe $p_args $OCF_RESKEY_options
$host' $rc: $p_out";;</font>
<br><font size=2 face="sans-serif">        esac</font>
<br><font size=2 face="sans-serif">    done</font>
<br><font size=2 face="sans-serif">    score=`expr $active \*
$OCF_RESKEY_multiplier`</font>
<br><font size=2 face="sans-serif">    attrd_updater -n $OCF_RESKEY_name
-v $score -d $OCF_RESKEY_dampen $attrd_options</font>
<br><font size=2 face="sans-serif">    rc=$?</font>
<br><font size=2 face="sans-serif">    case $rc in </font>
<br><font size=2 face="sans-serif">        0)
ping_conditional_log debug "Updated $OCF_RESKEY_name = $score"
;;</font>
<br><font size=2 face="sans-serif">        *)
ocf_log warn "Could not update $OCF_RESKEY_name = $score: rc=$rc";;</font>
<br><font size=2 face="sans-serif">    esac</font>
<br><font size=2 face="sans-serif">    return $rc</font>
<br><font size=2 face="sans-serif">"</font>
<br>
<br><font size=2 face="sans-serif">as there is no response from this part
of the RA, the cluster reacts  in that way:</font>
<br><font size=2 face="sans-serif">"</font><tt><font size=2>Jan  5
08:40:33 node2 crmd: [5993]: ERROR: process_lrm_event: LRM<br>
>> operation pingd:0_monitor_15000 (48559) Timed Out (timeout=5000ms)</font></tt><font size=2 face="sans-serif">"</font>
<br>
<br><font size=2 face="sans-serif">this is what i assume.</font>
<br>
<br><font size=2 face="sans-serif">kr patrik</font>
<br>
<br>
<br>
<br>
<br><font size=2 face="sans-serif"><br>
</font><font size=2 color=#5f5f5f face="sans-serif">Mit freundlichen Grüßen
/ Best Regards<br>
<b><br>
Patrik Rapposch, BSc</b><br>
System Administration<br>
<b><br>
KNAPP Systemintegration GmbH</b><br>
Waltenbachstraße 9<br>
8700 Leoben, Austria <br>
Phone: +43 3842 805-915<br>
Fax: +43 3842 82930-500<br>
patrik.rapposch@knapp.com <br>
</font><a href=www.KNAPP.com><font size=2 color=#5f5f5f face="sans-serif">www.KNAPP.com</font></a><font size=2 color=#5f5f5f face="sans-serif">
<br>
<br>
Commercial register number: FN 138870x<br>
Commercial register court: Leoben</font><font size=2 face="sans-serif"><br>
</font><font size=1 color=#d2d2d2 face="sans-serif"><br>
The information in this e-mail (including any attachment) is confidential
and intended to be for the use of the addressee(s) only. If you have received
the e-mail by mistake, any disclosure, copy, distribution or use of the
contents of the e-mail is prohibited, and you must delete the e-mail from
your system. As e-mail can be changed electronically KNAPP assumes no responsibility
for any alteration to this e-mail or its attachments. KNAPP has taken every
reasonable precaution to ensure that any attachment to this e-mail has
been swept for virus. However, KNAPP does not accept any liability for
damage sustained as a result of such attachment being virus infected and
strongly recommend that you carry out your own virus check before opening
any attachment.</font>
<br>
<br>
<br>
<table width=100%>
<tr valign=top>
<td width=40%><font size=1 face="sans-serif"><b>Andreas Kurz <andreas.kurz@linbit.com></b>
</font>
<p><font size=1 face="sans-serif">10.01.2011 15:41</font>
<table border>
<tr valign=top>
<td bgcolor=white>
<div align=center><font size=1 face="sans-serif">Bitte antworten an<br>
The Pacemaker cluster resource manager        <pacemaker@oss.clusterlabs.org></font></div></table>
<br>
<td width=59%>
<table width=100%>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">An</font></div>
<td><font size=1 face="sans-serif">pacemaker@oss.clusterlabs.org</font>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">Kopie</font></div>
<td>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">Thema</font></div>
<td><font size=1 face="sans-serif">Re: [Pacemaker] Fw: Antwort: Re: pingd
process dies for no reason</font></table>
<br>
<table>
<tr valign=top>
<td>
<td></table>
<br></table>
<br>
<br>
<br><tt><font size=2>On 2011-01-10 13:35, Patrik.Rapposch@knapp.com wrote:<br>
> Anyone an idea or did anyone have the same problem?<br>
<br>
sorry for the question ;-) ... of course you checked your host<br>
xxx.xxx.xxx.xxx is ping-able from the cluster nodes? only idea here is
a<br>
firewall somewhere.<br>
<br>
Regards,<br>
Andreas<br>
<br>
> <br>
> <br>
> Mit freundlichen Grüßen / Best Regards<br>
> *<br>
> Patrik Rapposch, BSc*<br>
> System Administration<br>
> *<br>
> KNAPP Systemintegration GmbH*<br>
> Waltenbachstraße 9<br>
> 8700 Leoben, Austria<br>
> Phone: +43 3842 805-915<br>
> Fax: +43 3842 82930-500<br>
> patrik.rapposch@knapp.com<br>
> </font></tt><a href=www.KNAPP.com><tt><font size=2>www.KNAPP.com</font></tt></a><tt><font size=2><br>
> <br>
> Commercial register number: FN 138870x<br>
> Commercial register court: Leoben<br>
> <br>
> The information in this e-mail (including any attachment) is<br>
> confidential and intended to be for the use of the addressee(s) only.
If<br>
> you have received the e-mail by mistake, any disclosure, copy,<br>
> distribution or use of the contents of the e-mail is prohibited, and
you<br>
> must delete the e-mail from your system. As e-mail can be changed<br>
> electronically KNAPP assumes no responsibility for any alteration
to<br>
> this e-mail or its attachments. KNAPP has taken every reasonable<br>
> precaution to ensure that any attachment to this e-mail has been swept<br>
> for virus. However, KNAPP does not accept any liability for damage<br>
> sustained as a result of such attachment being virus infected and<br>
> strongly recommend that you carry out your own virus check before<br>
> opening any attachment.<br>
> ----- Weitergeleitet von Patrik Rapposch/KSI am 10.01.2011 13:35 -----<br>
> *Patrik.Rapposch@knapp.com*<br>
> <br>
> 07.01.2011 16:38<br>
> Bitte antworten an<br>
> The Pacemaker cluster resource manager      <br>
>  <pacemaker@oss.clusterlabs.org><br>
> <br>
> <br>
>                  <br>
> An<br>
>                  The
Pacemaker cluster resource manager <pacemaker@oss.clusterlabs.org><br>
> Kopie<br>
>                  <br>
> Thema<br>
>                  [Pacemaker]
Antwort: Re:  pingd process dies for no reason<br>
> <br>
> <br>
>                  <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> Hello,<br>
> <br>
> thx for your fast reply, we use the ping ressource, you can see it
in<br>
> our config, its just the id which is called pingd, i admit this is
a<br>
> little confusing.:*<br>
> "**<primitive class="ocf" id="pingd" provider="pacemaker"<br>
>> /type="ping"/>**"*<br>
> <br>
> kr patrik<br>
> <br>
> <br>
> Mit freundlichen Grüßen / Best Regards*<br>
> <br>
> Patrik Rapposch, BSc*<br>
> System Administration*<br>
> <br>
> KNAPP Systemintegration GmbH*<br>
> Waltenbachstraße 9<br>
> 8700 Leoben, Austria<br>
> Phone: +43 3842 805-915<br>
> Fax: +43 3842 82930-500<br>
> patrik.rapposch@knapp.com _<br>
> __www.KNAPP.com_<br>
> <br>
> Commercial register number: FN 138870x<br>
> Commercial register court: Leoben<br>
> <br>
> The information in this e-mail (including any attachment) is<br>
> confidential and intended to be for the use of the addressee(s) only.
If<br>
> you have received the e-mail by mistake, any disclosure, copy,<br>
> distribution or use of the contents of the e-mail is prohibited, and
you<br>
> must delete the e-mail from your system. As e-mail can be changed<br>
> electronically KNAPP assumes no responsibility for any alteration
to<br>
> this e-mail or its attachments. KNAPP has taken every reasonable<br>
> precaution to ensure that any attachment to this e-mail has been swept<br>
> for virus. However, KNAPP does not accept any liability for damage<br>
> sustained as a result of such attachment being virus infected and<br>
> strongly recommend that you carry out your own virus check before<br>
> opening any attachment.<br>
> <br>
> *Michael Schwartzkopff <misch@clusterbau.com>*<br>
> <br>
> 07.01.2011 15:02<br>
> Bitte antworten an<br>
> The Pacemaker cluster resource manager      <br>
>  <pacemaker@oss.clusterlabs.org><br>
> <br>
>                  <br>
> An<br>
>                  The
Pacemaker cluster resource manager <pacemaker@oss.clusterlabs.org><br>
> Kopie<br>
>                  <br>
> Thema<br>
>                  Re:
[Pacemaker] pingd process dies for no reason<br>
> <br>
> <br>
> <br>
>                  <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> On Friday 07 January 2011 14:56:03 Patrik.Rapposch@knapp.com wrote:<br>
>> Greetings,<br>
>><br>
>> we have a problem, that the ping daemon dies for no reason and
we can't<br>
>> find why this happened.<br>
>><br>
>> we use following versions on SLES 11.1:<br>
>><br>
>> libpacemaker3-1.1.2-0.6.1<br>
>> pacemaker-mgmt-2.0.0-0.3.10<br>
>> pacemaker-mgmt-client-2.0.0-0.3.10<br>
>> drbd-pacemaker-8.3.8.1-0.2.9<br>
>> libpacemaker-devel-1.1.2-0.6.1<br>
>> pacemaker-1.1.2-0.6.1<br>
>> pacemaker-mgmt-devel-2.0.0-0.3.10<br>
>> libcorosync4-1.2.6-0.2.2<br>
>> corosync-1.2.6-0.2.2<br>
>> libcorosync-devel-1.2.6-0.2.2<br>
>><br>
>> here is the important part of the log trace:<br>
>> "<br>
>> Jan  5 08:40:30 node2 lrmd: [5990]: info: rsc:OSR_IP:46535:
monitor<br>
>> Jan  5 08:40:30 node2 lrmd: [5990]: info: rsc:Cluster_IP:46533:
monitor<br>
>> Jan  5 08:40:33 node2 lrmd: [5990]: WARN: pingd:0:monitor
process (PID<br>
>> 23937) timed out (try 1).  Killing with signal SIGTERM (15).<br>
>> Jan  5 08:40:33 node2 lrmd: [5990]: WARN: operation monitor[48559]
on<br>
>> ocf::ping::pingd:0 for client 5993, its parameters: CRM_meta_clone=[0]<br>
>> host_list=[xxx.xxx.xxx.xxx] CRM_meta_clone_node_max=[1]<br>
>> CRM_meta_clone_max=[2] CRM_meta_notify=[false] dampen=[5s]<br>
>> CRM_meta_globally_unique=[false] crm_feature_set=[3.0.2] multiplier=[100]<br>
>> CRM_meta_name=[monitor] CRM_meta_interval=[15000] CRM_meta_timeout=[5000]<br>
>><br>
>> : pid [23937] timed out<br>
>><br>
>> Jan  5 08:40:33 node2 crmd: [5993]: ERROR: process_lrm_event:
LRM<br>
>> operation pingd:0_monitor_15000 (48559) Timed Out (timeout=5000ms)<br>
>> Jan  5 08:40:33 node2 crmd: [5993]: WARN: update_failcount:
Updating<br>
>> failcount for pingd:0 on node2 after failed monitor: rc=-2<br>
>> (update=value++, time=1294213233)<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: notice: unpack_config:
On loss of<br>
>> CCM Quorum: Ignore<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: WARN: unpack_rsc_op:
Processing<br>
>> failed op drbd_r0:1_promote_0 on node1: unknown exec error (-2)<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: WARN: unpack_rsc_op:
Processing<br>
>> failed op pingd:0_monitor_15000 on node2: unknown exec error (-2)<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: notice: clone_print:
 Clone Set:<br>
>> pingdclone [pingd]<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: notice: native_print:
     pingd:0<br>
>> (ocf::pacemaker:ping):  Started node2 FAILED<br>
>> Jan  5 08:40:35 node2 pengine: [5992]: notice: short_print:
     Started:<br>
>> [ node1 ]"<br>
>><br>
>> the ressource is configured in following way:<br>
>> <clone id="pingdclone"><br>
>>         <meta_attributes id="pingdclone-meta_attributes"><br>
>>           <nvpair id="pingdclone-meta_attributes-globally-unique"<br>
>> name="globally-unique" value="false"/><br>
>>         </meta_attributes><br>
>>         <primitive class="ocf"
id="pingd" provider="pacemaker"<br>
>> type="ping"><br>
>>           <instance_attributes id="pingd-instance_attributes"><br>
>>             <nvpair id="pingd-instance_attributes-host_list"<br>
>> name="host_list" value="xxx.xxx.xxx.xxx"/><br>
>>             <nvpair id="pingd-instance_attributes-multiplier"<br>
>> name="multiplier" value="100"/><br>
>>             <nvpair id="nvpair-96877c9e-2825-4d7d-997b-944652f89584"<br>
>> name="dampen" value="5s"/><br>
>>           </instance_attributes><br>
>>           <operations><br>
>>             <op id="pingd-monitor-15s"
interval="15s" name="monitor"<br>
>> timeout="5s"/><br>
>>           </operations><br>
>>         </primitive><br>
>>       </clone><br>
>><br>
>> thx for your help in advance.<br>
>><br>
>> Mit freundlichen Grüßen / Best Regards<br>
>><br>
>> Patrik Rapposch, BSc<br>
> <br>
> Please use the "ping" resource agent instead of the "pingd"<br>
> <br>
> Greetings,<br>
> <br>
> -- <br>
> Dr. Michael Schwartzkopff<br>
> Guardinistr. 63<br>
> 81375 München<br>
> <br>
> Tel: (0163) 172 50 98<br>
> _______________________________________________<br>
> Pacemaker mailing list: Pacemaker@oss.clusterlabs.org_<br>
> __http://oss.clusterlabs.org/mailman/listinfo/pacemaker_<br>
> <br>
> Project Home: _http://www.clusterlabs.org_ <</font></tt><a href=http://www.clusterlabs.org/><tt><font size=2>http://www.clusterlabs.org/</font></tt></a><tt><font size=2>><br>
> Getting started: _http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf_<br>
> Bugs:<br>
> _http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker_<br>
> _______________________________________________<br>
> Pacemaker mailing list: Pacemaker@oss.clusterlabs.org<br>
> </font></tt><a href=http://oss.clusterlabs.org/mailman/listinfo/pacemaker><tt><font size=2>http://oss.clusterlabs.org/mailman/listinfo/pacemaker</font></tt></a><tt><font size=2><br>
> <br>
> Project Home: </font></tt><a href=http://www.clusterlabs.org/><tt><font size=2>http://www.clusterlabs.org</font></tt></a><tt><font size=2>
<</font></tt><a href=http://www.clusterlabs.org/><tt><font size=2>http://www.clusterlabs.org/</font></tt></a><tt><font size=2>><br>
> Getting started: </font></tt><a href=http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf><tt><font size=2>http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</font></tt></a><tt><font size=2><br>
> Bugs:<br>
> </font></tt><a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker"><tt><font size=2>http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</font></tt></a><tt><font size=2><br>
> <br>
> <br>
> <br>
> _______________________________________________<br>
> Pacemaker mailing list: Pacemaker@oss.clusterlabs.org<br>
> </font></tt><a href=http://oss.clusterlabs.org/mailman/listinfo/pacemaker><tt><font size=2>http://oss.clusterlabs.org/mailman/listinfo/pacemaker</font></tt></a><tt><font size=2><br>
> <br>
> Project Home: </font></tt><a href=http://www.clusterlabs.org/><tt><font size=2>http://www.clusterlabs.org</font></tt></a><tt><font size=2><br>
> Getting started: </font></tt><a href=http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf><tt><font size=2>http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</font></tt></a><tt><font size=2><br>
> Bugs: </font></tt><a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker"><tt><font size=2>http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</font></tt></a><tt><font size=2><br>
<br>
_______________________________________________<br>
Pacemaker mailing list: Pacemaker@oss.clusterlabs.org<br>
</font></tt><a href=http://oss.clusterlabs.org/mailman/listinfo/pacemaker><tt><font size=2>http://oss.clusterlabs.org/mailman/listinfo/pacemaker</font></tt></a><tt><font size=2><br>
<br>
Project Home: </font></tt><a href=http://www.clusterlabs.org/><tt><font size=2>http://www.clusterlabs.org</font></tt></a><tt><font size=2><br>
Getting started: </font></tt><a href=http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf><tt><font size=2>http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</font></tt></a><tt><font size=2><br>
Bugs: </font></tt><a href="http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker"><tt><font size=2>http://developerbugs.linux-foundation.org/enter_bug.cgi?product=Pacemaker</font></tt></a><tt><font size=2><br>
</font></tt>
<br>