<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">>> Hi,<br>
>><br>
>> There is the ocf:heartbeat:Delay resource agent, which on one hand is<br>
>> documented as a test resource, but on the other hand should do what you<br>
>> need:<br>
>><br>
>> primitive solr ...<br>
>> primitive two-minute-delay ocf:heartbeat:Delay \<br>
>>   params startdelay=120 meta target-role=Started \<br>
>> op start timeout=180<br>
>> group solr-then-wait solr two-minute-delay<br>>><br>>> Now the group acts basically like the solr resource, except for the<br>>> two-minute delay after starting solr before the group itself is<br>>> considered started.<br>>><br>>> Cheers,<br>>> Kristoffer<br>>><br>>>><br>>>> / Jocke<br>
><br>>Another way would be to customize the tomcat resource agent so that<br>>start doesn't return success until it's fully ready to accept requests<br>>(which would probably be specific to whatever app you're running via<br>>tomcat). Of course you'd need a long start timeout.<br><br></blockquote><div>Thanks for the tips guys!<br>I'm using the systemd RA of tomcat (I know it's not recommended) and can't seem to figure out  how to go about postponing the success return.<br>Maybe I'll try the OCF one later.<br><br>When adding the Delay RA it starts throwing a bunch of errors and the cluster starts fencing the nodes one by one.<br><br>The error's I get with "pcs status":</div><div><br><div><div>Failed Actions:</div><div>* Delay_monitor_0 on node03 'unknown error' (1): call=51, status=Timed Out, exit</div><div>reason='none',</div><div>    last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30002ms</div><div>* Delay_monitor_0 on node01 'unknown error' (1): call=53, status=Timed Out, exit</div><div>reason='none',</div><div>    last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30002ms</div><div>* Delay_monitor_0 on node02 'unknown error' (1): call=51, status=Timed Out, exit</div><div>reason='none',</div><div>    last-rc-change='Thu Jan 14 13:30:14 2016', queued=0ms, exec=30006ms</div><div><br></div>and in the /var/log/pacemaker.log:<br><br><a href="https://github.com/apepojken/pacemaker-errors/blob/master/ocf:heartbeat:Delay">https://github.com/apepojken/pacemaker-errors/blob/master/ocf:heartbeat:Delay</a><br><br>I added the Delay RA with:<br><br><div><div>pcs resource create Delay ocf:heartbeat:Delay \</div><div>startdelay="120" meta target-role=Started \</div><div>op start timeout="180"</div></div><div><br>and my config looks like this:<br><br><a href="https://github.com/apepojken/pacemaker/blob/master/Config">https://github.com/apepojken/pacemaker/blob/master/Config</a><br><br>Am I missing something obvious here?<br><br>Thanks again for all the help so far!<br><br></div></div></div></div></div></div>