<div dir="ltr">Thanks Andrei, Digimer.<div><br></div><div>I see. Since I need to address this discussion to a definitive solution, I am sharing you a diagram of how we are designing this HA architecture, to clarify the problem we are trying to solve:<div><br></div><div><a href="http://i.imgur.com/BFPcZSx.png">http://i.imgur.com/BFPcZSx.png</a></div><div><br></div><div>The first layer, Load Balancer; and the third later, Database, are both already setup. The Load Balancer cluster uses only an VIP resource, while Database cluster uses DRBD+VIP resources. They are on production and work fine, test passed :-)</div><div><br></div><div>Now we are handling the Web Server layer, which I am discussing with experts like you. These servers require to be all active and see the same data for read & write, as quickly as possible, mainly reads. </div><div><br></div><div><br></div><div><b>So, If we stay with OCFS2: </b>Since we need to protect the service availability and keep most of nodes up, what choices do I have to avoid reboots on both Web nodes caused by a split-brain situation when one of them is disconnected from network?</div><div><br></div><div>Correct me if I'm wrong:</div><div><br></div><div><b>1. Redundant Channel:</b> This is pretty difficult, since we would have to add two new physical netword cards to the virtual machine hosts, and that changes network configuration a lot in the virtualization platform.</div><div><br></div><div><div><b>2. Three Node Cluster:</b> This is possible, but it will consume more resources. We can have it only for cluster communication though, not for web processing, that will decrease load.</div></div><div><br></div><div><b>3. Disable Fencing:</b> You said this should not happen at all if we use a shared disk like OCFS. So I am discarding it.</div><div><br></div><div><b>4. Use NFS: </b>Yes, this will cause a SPoF, and to solve it we would have to setup another cluster with DRBD as described <a href="https://www.suse.com/documentation/sle_ha/singlehtml/book_sleha_techguides/book_sleha_techguides.html">here</a>, and add more infrastructure resources, or do we can setup NFS over OCFS2?</div></div><div><br></div><div>Thanks in advance.</div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><div dir="ltr"><div><b style="font-family:verdana,sans-serif"><font color="#666666">Jonathan Vargas Rodríguez</font></b><br></div><font face="verdana, sans-serif"><font color="#666666">Founder and Solution Engineer</font></font><br></div><div><font face="verdana, sans-serif"><font color="#666666"><a href="https://alkaid.cr/" target="_blank">Alkaid</a> | Open Source Software</font></font></div><div><br></div><div dir="ltr"><div><font face="courier new, monospace"><font color="#ffffff"><b style="background-color:rgb(111,168,220)"> mail </b></font><b style="color:rgb(68,68,68)">  </b></font><font face="verdana, sans-serif" color="#666666"><a href="mailto:jonathan.vargas@alkaid.cr" target="_blank">jonathan.vargas@alkaid.cr</a></font></div><div><font face="courier new, monospace"><font color="#ffffff" style="font-weight:bold;background-color:rgb(147,196,125)"> telf </font><font style="color:rgb(68,68,68);font-weight:bold">  </font></font><font face="verdana, sans-serif" color="#666666">+506 4001 6259 Ext. 01 </font></div><div><font face="courier new, monospace"><font color="#ffffff" style="font-weight:bold;background-color:rgb(246,178,107)"> mobi </font><font color="#444444" style="font-weight:bold"> </font><font color="#444444" style="font-weight:bold"> </font></font><span style="color:rgb(102,102,102);font-family:verdana,sans-serif;font-size:12.8000001907349px">+506 4001 6259 Ext. 51 </span></div><div><br></div></div><div dir="ltr"><div style="font-size:12.8000001907349px"><div><a href="http://linkedin.com/in/jonathanvargas/" target="_blank"><img src="https://alkaid.cr/images/theme/icons/social/linkedin.png"></a>      <a href="https://plus.google.com/+JonathanVargas/" target="_blank"><img src="https://alkaid.cr/images/theme/icons/social/googleplus.png"></a>      <a href="https://www.facebook.com/alkaid.cr" target="_blank"><img src="https://alkaid.cr/images/theme/icons/social/facebook.png"></a>      <a href="https://twitter.com/alkaidcr" target="_blank"><img src="https://alkaid.cr/images/theme/icons/social/twitter.png"></a>  </div><div><br></div></div><div style="font-size:12.8000001907349px"><div></div></div></div></div></div></div>
<br><div class="gmail_quote">2015-06-09 22:03 GMT-06:00 Andrei Borzenkov <span dir="ltr"><<a href="mailto:arvidjaar@gmail.com" target="_blank">arvidjaar@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">В Tue, 9 Jun 2015 21:53:41 -0600<br>
Jonathan Vargas <<a href="mailto:jonathan.vargas@alkaid.cr">jonathan.vargas@alkaid.cr</a>> пишет:<br>
<span class=""><br>
> Thanks,<br>
><br>
> Those nodes do not need coordination between them. They have been working<br>
> so far until now without HA and OCFS2. A load balancer distributes the<br>
> requests between both nodes, they do not know about the existence of each<br>
> other.<br>
><br>
> However, they do require shared storage to work with the same data. Before<br>
> setting up the OCFS2 cluster, we have been syncing disks using rsync, but<br>
> it syncs each minute, not real time.<br>
><br>
> So, our requirement would depend on OCFS2, and it works, but not of an HA<br>
> and stonith setup I think. I see no way how it could add value to the<br>
> required solution. Or it does?<br>
><br>
<br>
</span>You need coordination between nodes on write and even if you mount your<br>
system read-only you still have at least boot time journal replay. So<br>
no, your nodes cannot free run.<br>
<br>
You probably want to use NFS for this.<br>
</blockquote></div><br></div>