<div dir="ltr"><div><div><div>Thanks for the info, was trying to configure IPMI in the servers.<br></div>Can you please suggest a configuration procedure for enabling and configuring the IPMI(Which you might have referred to).<br></div>The sites I came across are not understandable.<br></div>The servers I'm using is DELL POWEREDGE R320<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Oct 28, 2014 at 7:55 PM, Digimer <span dir="ltr"><<a href="mailto:lists@alteeve.ca" target="_blank">lists@alteeve.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On 28/10/14 02:24 AM, kamal kishi wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi,<br>
<br>
  I know, no fencing configuration creates issue.<br>
But the current scenario is due to fencing??<br>
</blockquote>
<br></span>
Maybe, maybe not. I can say that *not* having it will make solving the problem much more difficult. Please get it working, it's pretty easy and it will make your life a lot easier.<span class=""><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
The syslog isn't revealing much about the same.<br>
I would love to configure fencing but currently need some solution to<br>
overcome the current scenario, if you say fencing is the only solution<br>
then I might have to do it remotely.<br>
</blockquote>
<br></span>
It is critical, yes. Please add it, test it and then hook DRBD into it.<span class=""><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
OS -> UBUNTU 12.04 (64 bits)<br>
DRBD -> 8.3.11<br>
</blockquote>
<br></span>
That is quite old. Can you update to 8.3.16? Also, what version is pacemaker and corosync?<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">
Thanks for the quick reply<br>
<br>
On Tue, Oct 28, 2014 at 11:19 AM, Digimer <<a href="mailto:lists@alteeve.ca" target="_blank">lists@alteeve.ca</a><br></span><div><div class="h5">
<mailto:<a href="mailto:lists@alteeve.ca" target="_blank">lists@alteeve.ca</a>>> wrote:<br>
<br>
    On 28/10/14 01:39 AM, kamal kishi wrote:<br>
<br>
        Hi all,<br>
<br>
                Facing a strange issue which I'm not able to resolve as<br>
        I'm not<br>
        sure where what is going wrong as the logs is not giving away<br>
        much to my<br>
        knowledge.<br>
<br>
        Issue -<br>
        Have configured 2 Node Clustering, have attached the configuration<br>
        file(New CRM conf of BIC.txt).<br>
<br>
        If Server2 which is primary is shutdown(forcefully by turning<br>
        off the<br>
        switch), Server1 restarts within few seconds and starts the<br>
        resources.<br>
        Even though the Server1 restarts and starts the resources the<br>
        time taken<br>
        to recover is too long to convince the clients and the current<br>
        working<br>
        is erroneous is what I feel.<br>
<br>
        Have attached the syslog with this mail.(syslog)<br>
<br>
        Do go through the same and let know a solution to resolve the<br>
        same as<br>
        the setup is in clients place.<br>
<br>
        --<br>
        Regards,<br>
        Kamal Kishore B V<br>
<br>
<br>
    You really need fencing, first and foremost. This will cause the<br>
    survivor to put the lost node into a known state and then safely<br>
    begin taking over lost services. Do your nodes have IPMI (or iRMC,<br>
    iLO, DRAC, etc)? If so, setting up stonith is easy.<br>
<br>
    Once it is setup, configure DRBD to use the fence-handler<br>
    'crm-fence-peer.sh' and change the fencing policy to<br>
    'resource-and-stonith'. Without this, you will get split-brains and<br>
    fail-over will be unpredictable.<br>
<br>
    Once stonith is configured and tested in pacemaker and you've hooked<br>
    DRBD's fencing into pacemaker, see if you problem remains. If it<br>
    does, on both nodes, run: 'tail -f -n 0 /var/log/messages', kill a<br>
    node and wait for things to settle down. Share the log output here.<br>
<br>
    Please also tell us your OS, pacemaker, drbd and corosync versions.<br>
<br>
    --<br>
    Digimer<br>
    Papers and Projects: <a href="https://alteeve.ca/w/" target="_blank">https://alteeve.ca/w/</a><br>
    What if the cure for cancer is trapped in the mind of a person<br>
    without access to education?<br>
<br></div></div>
    ______________________________<u></u>___________________<br>
    Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
    <mailto:<a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.<u></u>clusterlabs.org</a>><br>
    <a href="http://oss.clusterlabs.org/__mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/__<u></u>mailman/listinfo/pacemaker</a><span class=""><br>
    <<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/<u></u>mailman/listinfo/pacemaker</a>><br>
<br>
    Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
    Getting started:<br></span>
    <a href="http://www.clusterlabs.org/__doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/__<u></u>doc/Cluster_from_Scratch.pdf</a><span class=""><br>
    <<a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/<u></u>doc/Cluster_from_Scratch.pdf</a>><br>
    Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
<br>
<br>
<br>
<br>
--<br>
Regards,<br>
Kamal Kishore B V<br>
<br>
<br>
______________________________<u></u>_________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/<u></u>mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/<u></u>doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
<br>
</span></blockquote><div class="HOEnZb"><div class="h5">
<br>
<br>
-- <br>
Digimer<br>
Papers and Projects: <a href="https://alteeve.ca/w/" target="_blank">https://alteeve.ca/w/</a><br>
What if the cure for cancer is trapped in the mind of a person without access to education?<br>
<br>
______________________________<u></u>_________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/<u></u>mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/<u></u>doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Regards,<br>Kamal Kishore B V<br>
</div>