<div dir="ltr"><div>I don't get it.  Pacemaker + Corosync is providing me so much of functionality.<br></div><div>For e.g. if we leave out the condition of split-brain for a while, then it provides:</div><div>1) Discovery and cluster formation</div><div>2) Synchronization of data</div><div>3) Heartbeat mechanism</div><div>4) Swift failover of the resource</div><div>5) Guarantee that one resource will be started on only 1 node</div><div><br></div><div>So in case of normal fail-over we need the basic functionality of resource being migrated to a standby node.</div><div>And it is giving me all that.</div><div>So I don't agree that it needs to be as black and white as you say. Our solution has different requirements than a typical HA solution. But that is only now. In the future we might have to implement all the things. So in that sense Pacemaker gives us a good framework that we can extend.</div><div><br></div><div>BTW, we are not even using a virtual IP resource which again I believe is something that everyone employs.</div><div>Because of the nature of the service a small glitch is going to happen. Using virtual IPs is not giving any real benefit for us.</div><div>And with regard to the question, why even have a standby and let it be active all the time, two-node cluster is one of the possible configuration, but main requirement is to support N + 1. So standby node doesn't know which active it has to take over until a failover occurs.</div><div><br></div><div>Your comments however has made me re-consider using fencing. It was not that we didn't want to do it.</div><div>Just that I felt it may not be needed. So I'll definitely explore this further.</div><div><br></div><div>Thanks everyone for the comments. </div><div><br></div><div>-Regards </div><div>Nikhil</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Jun 21, 2016 at 10:17 PM, Digimer <span dir="ltr"><<a href="mailto:lists@alteeve.ca" target="_blank">lists@alteeve.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On 21/06/16 10:57 AM, Dmitri Maziuk wrote:<br>
> On 2016-06-20 17:19, Digimer wrote:<br>
><br>
>> Nikhil indicated that they could switch where traffic went up-stream<br>
>> without issue, if I understood properly.<br>
><br>
> They have some interesting setup, but that notwithstanding: if split<br>
> brain happens some clients will connect to "old master" and some: to<br>
> "new master", dep. on arp update. If there's a shared resource<br>
> unavailable on one node, clients going there will error out. The other<br>
> ones will not. It will work for some clients.<br>
><br>
> Cf. both nodes going into stonith deathmatch and killing each other: the<br>
> service now is not available for all clients. What I don't get is the<br>
> blanket assertion that this "more highly" available that option #1.<br>
><br>
> Dimitri<br>
<br>
</span>As I've explained many times (here and on IRC);<br>
<br>
If you don't need to coordinate services/access, you don't need HA.<br>
<br>
If you do need to coordinate services/access, you need fencing.<br>
<br>
So if Nikhil really believes s/he doesn't need fencing and that<br>
split-brains are OK, then drop HA. If that is not the case, then s/he<br>
needs to implement fencing in pacemaker. It's pretty much that simple.<br>
<span class="im HOEnZb"><br>
--<br>
Digimer<br>
Papers and Projects: <a href="https://alteeve.ca/w/" rel="noreferrer" target="_blank">https://alteeve.ca/w/</a><br>
What if the cure for cancer is trapped in the mind of a person without<br>
access to education?<br>
<br>
</span><div class="HOEnZb"><div class="h5">_______________________________________________<br>
Users mailing list: <a href="mailto:Users@clusterlabs.org">Users@clusterlabs.org</a><br>
<a href="http://clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">http://clusterlabs.org/mailman/listinfo/users</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" rel="noreferrer" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" rel="noreferrer" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" rel="noreferrer" target="_blank">http://bugs.clusterlabs.org</a><br>
</div></div></blockquote></div><br></div>