<div dir="ltr">Hi,<div><br></div><div style>It seem to be problem with network traffic.</div><div style><br></div><div style>Have you tried to sniff network traffic to be sure that udp traffic reaches from one node to another ??</div>
<div style><br></div><div style>Try on server1:</div><div style><br></div><div style>tcpdump -i interface -p udp -s <span style="font-family:arial,sans-serif;font-size:13px">192.168.100.112</span></div><div style><span style="font-family:arial,sans-serif;font-size:13px"><br>
</span></div><div style><span style="font-family:arial,sans-serif;font-size:13px">on server2:</span></div><div style><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div style>tcpdump -i interface -p udp -s <span style="font-size:13px;font-family:arial,sans-serif">192.168.100.111</span><span style="font-family:arial,sans-serif;font-size:13px"><br>
</span></div><div style><span style="font-size:13px;font-family:arial,sans-serif"><br></span></div><div style><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div><div style><font face="arial, sans-serif">if there will be no packet traffic, that means you have some network issue.</font></div>
<div style><font face="arial, sans-serif"><br></font></div><div style><font face="arial, sans-serif">BTW: Is SELinux enabled on nodes ??</font></div><div style><font face="arial, sans-serif"><br></font></div><div style><font face="arial, sans-serif">--</font></div>
<div style><font face="arial, sans-serif">Regards</font></div><div style><font face="arial, sans-serif">Andrew </font></div><div style><span style="font-family:arial,sans-serif;font-size:13px"><br></span></div></div><div class="gmail_extra">
<br><br><div class="gmail_quote">2013/1/30 Hans Bert <span dir="ltr"><<a href="mailto:dadeda2002@yahoo.de" target="_blank">dadeda2002@yahoo.de</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello,<br>
<br>
we had to move from Fedora 16 to Fedora 18 and wanted to set up Corosync with Pacemaker and PCS as management tool.<br>
With F16 our cluster was running pretty good, but with F18 after 5 days we are reaching the point were we don't have<br>
got ideas what might be the problem(s).<br>
<br>
<br>
The cluster is build of two servers (server1=192.168.100.111; server2=192.168.100.112)<br>
<br>
Based on the Howto for F18 with pcs we created the following corosync.conf:<br>
<br>
totem {<br>
  version: 2<br>
  secauth: off<br>
  cluster_name: mcscluster<br>
  transport: udpu<br>
}<br>
<br>
nodelist {<br>
  node {<br>
    ring0_addr: 192.168.100.111<br>
  }<br>
  node {<br>
    ring0_addr: 192.168.100.112<br>
  }<br>
}<br>
<br>
quorum {<br>
  provider: corosync_votequorum<br>
}<br>
<br>
logging {<br>
  fileline: off<br>
  to_stderr: no<br>
  to_logfile: yes<br>
  to_syslog: yes<br>
  logfile: /var/log/cluster/corosync.log<br>
  debug: on<br>
  timestamp: on<br>
}<br>
<br>
<br>
<br>
After we started the server a status check shows us:<br>
<br>
<br>
[root@server1 corosync]#pcs status corosync<br>
<br>
Membership information<br>
----------------------<br>
    Nodeid      Votes Name<br>
1868867776          1 server1 (local)<br>
<br>
[root@server1 ~]# pcs status<br>
Last updated: Wed Jan 30 10:45:17 2013<br>
Last change: Wed Jan 30 10:18:56 2013 via cibadmin on server1<br>
Stack: corosync<br>
Current DC: server1 (1868867776) - partition WITHOUT quorum<br>
Version: 1.1.8-3.fc18-394e906<br>
1 Nodes configured, unknown expected votes<br>
0 Resources configured.<br>
<br>
<br>
Online: [ server1 ]<br>
<br>
Full list of resources:<br>
<br>
<br>
<br>
And on the other server:<br>
<br>
<br>
[root@server2 corosync]# pcs status corosync<br>
<br>
Membership information<br>
----------------------<br>
    Nodeid      Votes Name<br>
1885644992          1 server2 (local)<br>
<br>
[root@server2 corosync]# pcs status<br>
Last updated: Wed Jan 30 10:44:40 2013<br>
Last change: Wed Jan 30 10:19:36 2013 via cibadmin on server2<br>
Stack: corosync<br>
Current DC: server2 (1885644992) - partition WITHOUT quorum<br>
Version: 1.1.8-3.fc18-394e906<br>
1 Nodes configured, unknown expected votes<br>
0 Resources configured.<br>
<br>
<br>
Online: [ server2 ]<br>
<br>
<br>
<br>
<br>
<br>
<br>
The only warnings and errors in the logfile are:<br>
<br>
[root@server1 ~]# cat /var/log/cluster/corosync.log | egrep "warning|error"<br>
Jan 30 10:25:59 [1608] server1       crmd:  warning: do_log:    FSA: Input I_DC_TIMEOUT from crm_timer_popped() received in state S_PENDING<br>
Jan 30 10:25:59 [1607] server1    pengine:  warning: cluster_status:    We do not have quorum - fencing and resource management disabled<br>
Jan 30 10:28:25 [1525] server1 corosync debug   [QUORUM] getinfo response error: 1<br>
Jan 30 10:40:59 [1607] server1    pengine:  warning: cluster_status:    We do not have quorum - fencing and resource management disabled<br>
<br>
<br>
root@server2 corosync]# cat /var/log/cluster/corosync.log | egrep "warning|error"<br>
Jan 30 10:27:18 [1458] server2       crmd:  warning: do_log:    FSA: Input I_DC_TIMEOUT from crm_timer_popped() received in state S_PENDING<br>
Jan 30 10:27:18 [1457] server2    pengine:  warning: cluster_status:    We do not have quorum - fencing and resource management disabled<br>
Jan 30 10:29:19 [1349] server2 corosync debug   [QUORUM] getinfo response error: 1<br>
Jan 30 10:42:18 [1457] server2    pengine:  warning: cluster_status:    We do not have quorum - fencing and resource management disabled<br>
Jan 30 10:44:36 [1349] server2 corosync debug   [QUORUM] getinfo response error: 1<br>
<br>
<br>
<br>
<br>
We have installed the following packages:<br>
<br>
corosync-2.2.0-1.fc18.i686<br>
corosynclib-2.2.0-1.fc18.i686<br>
drbd-bash-completion-8.3.13-1.fc18.i686<br>
drbd-pacemaker-8.3.13-1.fc18.i686<br>
drbd-utils-8.3.13-1.fc18.i686<br>
pacemaker-1.1.8-3.fc18.i686<br>
pacemaker-cli-1.1.8-3.fc18.i686<br>
pacemaker-cluster-libs-1.1.8-3.fc18.i686<br>
pacemaker-libs-1.1.8-3.fc18.i686<br>
pcs-0.9.27-3.fc18.i686<br>
<br>
<br>
<br>
Firewalls are disabled, Pinging and SSH communication is working without any problems.<br>
<br>
With best regards<br>
<br>
_______________________________________________<br>
Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>
Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf</a><br>
Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>
</blockquote></div><br></div>