<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Jan 18, 2021 at 11:18 PM Ulrich Windl <<a href="mailto:Ulrich.Windl@rz.uni-regensburg.de">Ulrich.Windl@rz.uni-regensburg.de</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">>>> Ken Gaillot <<a href="mailto:kgaillot@redhat.com" target="_blank">kgaillot@redhat.com</a>> schrieb am 18.01.2021 um 19:29 in<br>
Nachricht<br>
<<a href="mailto:1047fd943be77f4a6fd4cd4dd19b65d1550512f8.camel@redhat.com" target="_blank">1047fd943be77f4a6fd4cd4dd19b65d1550512f8.camel@redhat.com</a>>:<br>
> On Fri, 2021‑01‑15 at 11:40 +0100, Ulrich Windl wrote:<br>
>> Hi!<br>
>> <br>
>> With a cluster recheck interval, I see periodic log messages like<br>
>> this:<br>
>> Jan 15 11:05:50 h19 pacemaker‑controld[4804]:  notice: State<br>
>> transition S_TRANSITION_ENGINE ‑> S_IDLE<br>
>> Jan 15 11:15:50 h19 pacemaker‑controld[4804]:  notice: State<br>
>> transition S_IDLE ‑> S_POLICY_ENGINE<br>
> <br>
> The "transition" terminology is a little confusing. Note that the above<br>
> uses of it are just in the normal sense, i.e. the controller state<br>
> changed.<br>
> <br>
> The controller uses a finite state machine to keep track of what it's<br>
> doing now and next. Going from "transition engine" to "idle" means it<br>
> finished whatever needed to be done in that transition (in the more<br>
> technical Pacemaker sense). Going from "idle" to "police engine" means<br>
> it is ready to re‑invoke the scheduler to re‑check whether anything<br>
> needs to be done.<br>
> <br>
>> Jan 15 11:15:50 h19 pacemaker‑schedulerd[4803]:  notice: Watchdog<br>
>> will be used via SBD if fencing is required and stonith‑watchdog‑<br>
>> timeout is nonzero<br>
>> Jan 15 11:15:50 h19 pacemaker‑schedulerd[4803]:  notice: Calculated<br>
>> transition 596, saving inputs in /var/lib/pacemaker/pengine/pe‑input‑<br>
>> 41.bz2<br>
>> Jan 15 11:15:50 h19 pacemaker‑controld[4804]:  notice: Processing<br>
>> graph 596 (ref=pe_calc‑dc‑1610705750‑978) derived from<br>
>> /var/lib/pacemaker/pengine/pe‑input‑41.bz2<br>
>> Jan 15 11:15:50 h19 pacemaker‑controld[4804]:  notice: Transition 596<br>
>> (Complete=3, Pending=0, Fired=0, Skipped=0, Incomplete=0,<br>
>> Source=/var/lib/pacemaker/pengine/pe‑input‑41.bz2): Complete<br>
>> <br>
>> The "transition" number increases each time, while there is visible<br>
>> no action to be performed. So what's in such a "transition"? Couldn't<br>
>> the cluster skip those lines if there's nothing to do?<br>
>> <br>
>> Regards,<br>
>> Ulrich<br>
> <br>
> "Transition" as Pacemaker uses it in a technical sense is what you<br>
> called in a different post an "action plan". A transition is all<br>
> actions needed to bring the cluster to the desired state (as defined by<br>
> the configuration), given everything known about the cluster at the<br>
> moment (represented by the complete CIB including configuration and<br>
> status).<br>
> <br>
> The controller starts a new transition whenever something interesting<br>
> happens (like a resource monitor failure), when a transition action<br>
> returns an unexpected result (like a start failing instead of<br>
> succeeding), and periodically (according to cluster‑recheck‑interval).<br>
> <br>
> In any case, it's possible there's nothing to do, so the transition has<br>
> no actions. It's still a record that the cluster checked whether<br>
> anything needed to be done, and decided no. I have considered lowering<br>
> the log message to info level in that case, though ‑‑ that probably<br>
> makes sense.<br>
<br>
If its something that is expected to happen frequently under normal<br>
conditions, I also think "info" instead of "notice" would be OK as well, but<br>
what about pe-input?<br>
Is a new file required even if there's nothing to do?</blockquote><div><br></div><div>Nope. For example, nothing's been happening in my cluster. The transition number increments, but the pe-input file stays the same.<br></div><div><br></div><div># grep 'Calculated transition' /var/log/pacemaker/pacemaker.log | tail -n 5<br>Jan 18 22:12:13 fastvm-rhel-8-0-23 pacemaker-schedulerd[7699] (pcmk__log_transition_summary@pcmk_sched_allocate.c:2897)    notice: Calculated transition 1003, saving inputs in /var/lib/pacemaker/pengine/pe-input-376.bz2<br>Jan 18 22:27:13 fastvm-rhel-8-0-23 pacemaker-schedulerd[7699] (pcmk__log_transition_summary@pcmk_sched_allocate.c:2897)       notice: Calculated transition 1004, saving inputs in /var/lib/pacemaker/pengine/pe-input-376.bz2<br>Jan 18 22:42:13 fastvm-rhel-8-0-23 pacemaker-schedulerd[7699] (pcmk__log_transition_summary@pcmk_sched_allocate.c:2897)       notice: Calculated transition 1005, saving inputs in /var/lib/pacemaker/pengine/pe-input-376.bz2<br>Jan 18 22:57:13 fastvm-rhel-8-0-23 pacemaker-schedulerd[7699] (pcmk__log_transition_summary@pcmk_sched_allocate.c:2897)       notice: Calculated transition 1006, saving inputs in /var/lib/pacemaker/pengine/pe-input-376.bz2<br>Jan 18 23:12:13 fastvm-rhel-8-0-23 pacemaker-schedulerd[7699] (pcmk__log_transition_summary@pcmk_sched_allocate.c:2897)       notice: Calculated transition 1007, saving inputs in /var/lib/pacemaker/pengine/pe-input-376.bz2<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">I could imagine reusing<br>
the last number if the last transition had no actions other than<br>
monitor/probe.<br>
Of course that would not work if inputs are interleaved (the next begins<br>
before the last one has finished).<br>
<br>
Regards,<br>
Ulrich<br>
<br>
<br>
> ‑‑ <br>
> Ken Gaillot <<a href="mailto:kgaillot@redhat.com" target="_blank">kgaillot@redhat.com</a>><br>
> <br>
> _______________________________________________<br>
> Manage your subscription:<br>
> <a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a> <br>
> <br>
> ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a> <br>
<br>
<br>
<br>
_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div>Regards,<br><br></div>Reid Wahl, RHCA<br></div><div>Senior Software Maintenance Engineer, Red Hat<br></div>CEE - Platform Support Delivery - ClusterHA</div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>