Andrew,<br><br>I can confirm that the bug is gone in 1.1.8 or at least I cannot trigger it anymore.<br><br>Cheers.<br><br><div class="gmail_quote">On Tue, Sep 11, 2012 at 10:51 AM, Andrew Beekhof <span dir="ltr"><<a href="mailto:andrew@beekhof.net" target="_blank">andrew@beekhof.net</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On Tue, Sep 11, 2012 at 4:58 PM, Borislav Borisov<br>
<<a href="mailto:borislav.v.borisov@gmail.com">borislav.v.borisov@gmail.com</a>> wrote:<br>
><br>
>> Pacemaker creates a second cib process to write the contents to disk<br>
>> after a change so that the 'real' process doesn't block.<br>
>><br>
>> After the process writes the cib to disk, we then try to read it back<br>
>> again to verify that everything is sane.<br>
>> What you're seeing here is that check failing for some reason.<br>
><br>
><br>
> Because this much I could tell from the code, I was perplexed from that<br>
> behavior.<br>
<br>
</div>Would you not say its better to know /now/ that what we wrote to disk<br>
is unusable (or just not what you intended)?<br>
Or would you prefer to find out the next time the node booted :)<br>
<br>
Either way, Pacemaker will continue to function normally - the current<br>
CIB just wont be written to disk on that one node.<br>
<div class="im HOEnZb"><br>
>><br>
>> Looking at the logs I see:<br>
>><br>
>> Sep 10 15:24:40 Cluster-Server-1 cib: [54564]: ERROR:<br>
>> validate_cib_digest: Digest comparision failed: expected<br>
>> 83751b899e758f9b138d060ace084080 (/var/lib/heartbeat/crm/cib.ANRY1Q),<br>
>> calculated bd97ef3df10846e783bd64059be77e45<br>
>> Sep 10 15:24:40 Cluster-Server-1 cib: [54564]: ERROR: retrieveCib:<br>
>> Checksum of /var/lib/heartbeat/crm/cib.uGGnOm failed!  Configuration<br>
>> contents ignored!<br>
>><br>
>> Which is really strange.<br>
>> I see a couple of changes in related areas since 1.1.7, perhaps one of<br>
>> those will fix your issue.<br>
>> (1.1.8 should be out today/tomorrow)<br>
><br>
><br>
> I guess that I will wait for the next release and see if the issue is fixed<br>
> in it.<br>
><br>
> Anyway, thanks a bunch Andrew.<br>
><br>
><br>
</div><div class="HOEnZb"><div class="h5">> _______________________________________________<br>
> Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
> <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
><br>
> Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
> Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
> Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
><br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br>