<div dir="ltr">Thanks for the help guys.<br>I ended up patching together my own RA from the Delay and Dummy RA's and using curl to request the header of solr's ping request handler on localhost, which made the resource start return a bit more dynamic.<br>However, now I have another problem which I don't think is related to my RA.<br>For some reason when failing over the nodes, the ClusterIP (vIP below) seems to avoid the node running the fencing agent:<br><br>pcs status<br><br><div>Online: [ node01 node02 ]</div><div>OFFLINE: [ node03 ]</div><div><br></div><div>Full list of resources:</div><div><br></div><div> VMWare-fence   (stonith:fence_vmware_soap):    Started node02</div><div> Clone Set: dlm-clone [dlm]</div><div>     Started: [ node01 node02 ]</div><div>     Stopped: [ node03 ]</div><div> Clone Set: GFS2-clone [GFS2] (unique)</div><div>     GFS2:0     (ocf::heartbeat:Filesystem):    Started node01</div><div>     GFS2:1     (ocf::heartbeat:Filesystem):    Stopped</div><div>     GFS2:2     (ocf::heartbeat:Filesystem):    Started node02</div><div> Clone Set: Tomcat-clone [Tomcat]</div><div>     Started: [ node02 ]</div><div>     Stopped: [ node01 node03 ]</div><div> vIP    (ocf::heartbeat:IPaddr2):<span class="" style="white-space:pre">        </span>Stopped</div><div><br></div><div>Notice how the tomcat-clone is started on node02 but the vIP remains stopped.<br>If I start the fence agent on any of the other nodes the same thing happens (ie, vIP avoiding the fencing node)<br>Any idea why this happens?</div><div><br>Output of 'pcs config show': <a href="https://github.com/apepojken/pacemaker/blob/master/Config">https://github.com/apepojken/pacemaker/blob/master/Config</a><br><br>Thanks again!</div></div><div class="gmail_extra"><br><div class="gmail_quote">2016-01-20 1:14 GMT+01:00 Jan Pokorný <span dir="ltr"><<a href="mailto:jpokorny@redhat.com" target="_blank">jpokorny@redhat.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On 14/01/16 14:46 +0100, Kristoffer Grönlund wrote:<br>
> Joakim Hansson <<a href="mailto:joakim.hansson87@gmail.com">joakim.hansson87@gmail.com</a>> writes:<br>
>> When adding the Delay RA it starts throwing a bunch of errors and the<br>
>> cluster starts fencing the nodes one by one.<br>
>><br>
>> The error's I get with "pcs status":<br>
>><br>
>> Failed Actions:<br>
>> * Delay_monitor_0 on node03 'unknown error' (1): call=51, status=Timed Out,<br>
>> exit<br>
>> reason='none',<br>
>>     last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30002ms<br>
>> * Delay_monitor_0 on node01 'unknown error' (1): call=53, status=Timed Out,<br>
>> exit<br>
>> reason='none',<br>
>>     last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30002ms<br>
>> * Delay_monitor_0 on node02 'unknown error' (1): call=51, status=Timed Out,<br>
>> exit<br>
>> reason='none',<br>
>>     last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30006ms<br>
>><br>
>> and in the /var/log/pacemaker.log:<br>
>><br>
>> <a href="https://github.com/apepojken/pacemaker-errors/blob/master/ocf:heartbeat:Delay" rel="noreferrer" target="_blank">https://github.com/apepojken/pacemaker-errors/blob/master/ocf:heartbeat:Delay</a><br>
>><br>
>> I added the Delay RA with:<br>
>><br>
>> pcs resource create Delay ocf:heartbeat:Delay \<br>
>> startdelay="120" meta target-role=Started \<br>
>> op start timeout="180"<br>
>><br>
>> and my config looks like this:<br>
>><br>
>> <a href="https://github.com/apepojken/pacemaker/blob/master/Config" rel="noreferrer" target="_blank">https://github.com/apepojken/pacemaker/blob/master/Config</a><br>
>><br>
>> Am I missing something obvious here?<br>
><br>
</div></div><span class="">> It looks like you have a monitor operation configured for the Delay<br>
> resource, but you haven't set the mondelay parameter. But either way,<br>
> there is no reason to monitor the Delay resource, so remove that. Same<br>
> thing for the stop operation, just remove it.<br>
><br>
> I'm guessing pcs adds these by default.<br>
<br>
</span>It's true that pcs adds equivalent of "op monitor interval=60s"<br>
as an unconditional fallback when defining a new resource.<br>
Other operations are driven solely by explicit values or by<br>
defaults for particular resource, and this can be turned off<br>
via "--no-default-ops" option to pcs.<br>
<br>
FWIW, this could be a way to have monitor explicitly deactivated:<br>
<br>
    pcs resource create <name> <res> ... op monitor interval=0s<br>
<span class="HOEnZb"><font color="#888888"><br>
--<br>
Jan (Poki)<br>
</font></span></blockquote></div><br></div>