<br><br><div class="gmail_quote">On Fri, Feb 6, 2009 at 2:47 PM, Dominik Klein <span dir="ltr"><<a href="mailto:dk@in-telegence.net">dk@in-telegence.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">Romi Verma wrote:<br>
> On Fri, Feb 6, 2009 at 2:28 PM, Andrew Beekhof <<a href="mailto:beekhof@gmail.com">beekhof@gmail.com</a>> wrote:<br>
><br>
>> On Feb 6, 2009, at 9:53 AM, Romi Verma wrote:<br>
>><br>
>> Thanks Dominic,<br>
>> i have two questions now.<br>
>><br>
>> 1) what does no-quorum-policy= suicide means then??  does it remove the<br>
>> resource completely.<br>
>><br>
>><br>
>> no, the node kills itself and any other node in the partition<br>
>> this makes no sense in a 2 node cluster because both nodes will do this<br>
>><br>
><br>
> i assume the partition having less nodes will loose quorum and if<br>
> no-quorum-policy is set to suicide  then then they will commit suicide.<br>
>  like if in 3 nodes cluster , if one node looses communication to other<br>
> nodes then there will be two partitions . one will contain 2 nodes and<br>
> second will contain 1 node. partition having 2 nodes will be having quorum<br>
> and will not be affected. partition having 1 node will loose quourm and and<br>
> it will kill itself.  is my understanding is right??<br>
<br>
</div>correct<br>
<div class="Ih2E3d"><br>
> i want the partition without quorum to reset the nodes instead of killing .<br>
> is it possible.<br>
<br>
</div>define the difference between reset node and kill node? </blockquote><div><br> According to me  , killing a node means powering it off but reseting a node means rebooting it. <br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
<div class="Ih2E3d"><br>
>> 2) why each node is thinking itsef as DC as Andrew said after spilit brain<br>
>> election happens and one node is selected as DC.<br>
>><br>
>><br>
>> no, i said after the split-brain is _repaired_ an election occurs.<br>
>> clearly this can't happen during a split-brian because by definition they<br>
>> can't communicate.<br>
>><br>
><br>
> ok got it  , so how do we repair this spilit brain condition . by setting<br>
> no-quorum-policy to reset??  or is there any other way also.<br>
<br>
</div>stonith would reboot the node. This means, in case of a clustersoftware<br>
failure that led to loss of communication, the node reboots, restarts<br>
the cluster software and everything should be fine again.</blockquote><div><br> so you mean stonith should be used to handle spilit brain situation .  but .. but  dont you think in two nodes cluster if we get spilit brain situation both node will try to stonith each other.   <br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
If there's a network problem, you would of course have to fix that ;)</blockquote><div><br>:) <br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
<br>
Regards<br>
<font color="#888888">Dominik<br>
</font><div><div></div><div class="Wj3C7c"><br>
>> This is not happening in my case.<br>
>> i dont have any stonith configured in my cluster . do i need stonith to<br>
>> handle spilit brain situation.<br>
>><br>
>><br>
>><br>
>> On Fri, Feb 6, 2009 at 1:59 PM, Dominik Klein <<a href="mailto:dk@in-telegence.net">dk@in-telegence.net</a>> wrote:<br>
>><br>
>>> Romi Verma wrote:<br>
>>>> Thanks for fast reply ,<br>
>>>> Ok, Let me explain the situation. i have two nodes cluster . i pulled<br>
>>> out<br>
>>>> the network cable of one<br>
>>>> node which produced spilit brain situation. this time both nodes are<br>
>>>> thinking that other one is dead.  each node is thinking itself as DC and<br>
>>> on<br>
>>>> each node cluster is up and running without quorum.<br>
>>>><br>
>>>> i am new to openais/pacemaker so dont know much but according to some<br>
>>>> documents it seems by default no-quorum-policy is  to "stop" the<br>
>>> cluster. i<br>
>>>> have not specified any no-quorum-policy that's why i expect that my<br>
>>> cluster<br>
>>>> should stop if it looses quorum somehow.<br>
>>> The "stop" refers to the resources. policy=stop on a node with no quorum<br>
>>> means: do not run any resources.<br>
>>><br>
>>> "ignore" would mean: run resources even though we don't have quorum<br>
>>> (like the old heartbeat behaviour would be)<br>
>>><br>
>>> "freeze" would mean: run and manage what you did run up to this point,<br>
>>> but don't aquire any other resources.<br>
>>><br>
>>> Regards<br>
>>> Dominik<br>
>>><br>
>>>> But in present spilit brain situation , on each node cluster is up and<br>
>>>> running without quorum.   could you please explain why this is<br>
>>> happening.<br>
>>>> Romi<br>
>>>><br>
>>>><br>
>>>> On Fri, Feb 6, 2009 at 12:52 PM, Andrew Beekhof <<a href="mailto:beekhof@gmail.com">beekhof@gmail.com</a>><br>
>>> wrote:<br>
>>>>> Well the no-quorum-policy option applies during the split and an<br>
>>> election<br>
>>>>> is held to determine the DC when the partitions reform.<br>
>>>>> Can you be more specific please?<br>
>>>>> On Feb 6, 2009, at 4:54 AM, Romi Verma wrote:<br>
>>>>><br>
>>>>><br>
>>>>><br>
>>>>> hi all,<br>
>>>>>> how does openais + pacemaker (suse 11) cluster handles spilit brain<br>
>>>>>> situation .  can any one explain.<br>
>>>>>><br>
>>>>>> Thanks,<br>
>>>>>> Romi.<br>
<br>
_______________________________________________<br>
Pacemaker mailing list<br>
<a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
</div></div></blockquote></div><br>