<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"><title></title><head><meta http-equiv="Content-type" content="text/html; charset=UTF-8" /><style type="text/css"> html, body {overflow-x: visible; } html { width:100%; height:100%;margin:0px; padding:0px; overflow-y: auto; overflow-x: auto; }body { font-size: 100.01%; font-family : Verdana, Geneva, Arial, Helvetica, sans-serif; background-color:transparent; overflow:show; background-image:none; margin:0px; padding:5px; }p { margin:0px; padding:0px; } body { font-size: 12px; font-family : Verdana, Geneva, Arial, Helvetica, sans-serif; } p { margin: 0; padding: 0; } blockquote { padding-left: 5px; margin-left: 5px; margin-bottom: 0px; margin-top: 0px; } blockquote.quote { border-left: 1px solid #CCC; padding-left: 5px; margin-left: 5px; } .misspelled { background: transparent url(//webmailerng.1und1.de/static_resource/mailclient/widgets/basic/parts/maileditor/spellchecking_underline.gif) repeat-x scroll center bottom; } .correct {} .unknown {} .ignored {}</style></head><body id="bodyElement" style="">
<p>Hi,<span></span></p>
<p id="__paragraph__1298532797000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298532797000" style=""><span style="">my configuration has 2 nodes, one has a set of virtual adresses and a webservice. The situation before crash:</span></p>
<p id="__paragraph__1298532797000" style=""><span style="">node1: has all resources</span></p>
<p id="__paragraph__1298532797000" style=""><span style="">node2: online, no resources</span><span></span></p>
<p id="__paragraph__1298532911000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298532911000" style=""><span style="">action on node2: crm standby node2</span><span></span></p>
<p id="__paragraph__1298532946000" style=""><span style="">result on node1: corosync crashes, the child processes consume all available cpu time</span><span></span></p>
<p id="__paragraph__1298532991000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298532991000" style=""><span style="">my actions: stop all child processes on node1 (kill -9) and restart corosync</span><span></span></p>
<p id="__paragraph__1298533036000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298533036000" style=""><span style="">result on node1:</span><span></span></p>
<p id="__paragraph__1298533071000" style=""><span style="">node1: online, all resources</span><span></span></p>
<p id="__paragraph__1298533084000" style=""><span style="">node2: offline</span><span></span></p>
<p id="__paragraph__1298533092000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298533092000" style=""><span style="">result on node2:</span><span></span></p>
<p id="__paragraph__1298533101000" style=""><span style="">node1: offline</span><span></span></p>
<p id="__paragraph__1298533110000" style=""><span style="">node2: online, all resources</span><span></span></p>
<p id="__paragraph__1298533124000" style=""><br><span style=""></span></p>
<p id="__paragraph__1298533124000" style=""><span style="">The only way I found to workaround this problem: remove node2 from the cluster and add it again.</span><span></span></p>
<p id="__paragraph__1298533175000" style="">There should be other solutions, maybe someone can help. Appended the coredump and fplay.<span></span></p><p id="__paragraph__1298539858000" style=""><br><span style=""></span></p><p id="__paragraph__1298539858000" style=""><span style="">Update: If I keep the cluster in the split brain state, it recovers after about 9 hours (logfile available)<br></span></p>
<p id="__paragraph__1298533252000" style=""><br><span style=""></span></p>
<span style="">regards Uwe</span><basefont size="2" face="Verdana"></body></html>