<div dir="ltr">Everything is working fine now.. Thanks for every one who helped :)<br><br><div class="gmail_quote">On Wed, Jan 6, 2010 at 12:53 AM, Angie T. Muhammad <span dir="ltr"><<a href="mailto:angie.tawfik@gmail.com">angie.tawfik@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div dir="ltr">well, I am not sure if what I did is right or not, but:<div class="im"><br><br>
<span style="color: rgb(51, 51, 255);"># vim /etc/ha.d/<a href="http://ha.cf" target="_blank">ha.cf</a></span><br></div>crm on<br><br>// now crm_mon displays things as usual !!<br>
<span style="color: rgb(51, 102, 255);"># crm_mon -i5 </span><br><br>============<br>Last updated: Wed Jan  6 00:49:04 2010<br>Stack: Heartbeat<br>Current DC: <a href="http://node2.mydomain.com" target="_blank">node2.mydomain.com</a> (8e8ca99f-ff34-45c7-814b-d73d69889441) - partition with quorum<br>

Version: 1.0.6-f709c638237cdff7556cb6ab615f32826c0f8c06<br>2 Nodes configured, unknown expected votes<br>0 Resources configured.<br>============<br><br>Online: [ <a href="http://node1.mydomain.com" target="_blank">node1.mydomain.com</a> <a href="http://node2.mydomain.com" target="_blank">node2.mydomain.com</a> ]<br>

<br><br>Now, I 'll configure my resources under pacemaker as I always did and let you know of any progress / problems.<br>Thank you Dejan for keeping up with me on this issue :)<br>=====================================================================================<div>
<div></div><div class="h5"><br>
<br><br><br><br><div class="gmail_quote">On Wed, Jan 6, 2010 at 12:08 AM, Angie T. Muhammad <span dir="ltr"><<a href="mailto:angie.tawfik@gmail.com" target="_blank">angie.tawfik@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

<div dir="ltr">Hello,<br>Thank you for the prompt reply.<br><br>All permissions are correct, and here is the output of ulimit:<br><span style="color: rgb(51, 102, 255);"># cd /var/lib/heartbeat/cores/</span><br><span style="color: rgb(51, 102, 255);"># ulimit -a</span><br>


core file size          (blocks, -c) 0<br>data seg size           (kbytes, -d) unlimited<br>scheduling priority             (-e) 0<br>file size               (blocks, -f) unlimited<br>pending signals                 (-i) 73728<br>


max locked memory       (kbytes, -l) 32<br>max memory size         (kbytes, -m) unlimited<br>open files                      (-n) 1024<br>pipe size            (512 bytes, -p) 8<br>POSIX message queues     (bytes, -q) 819200<br>


real-time priority              (-r) 0<br>stack size              (kbytes, -s) 10240<br>cpu time               (seconds, -t) unlimited<br>max user processes              (-u) 73728<br>virtual memory          (kbytes, -v) unlimited<br>


file locks                      (-x) unlimited<br><br><i><br>what should I do in this respect?</i><div><div></div><div><br><br><div class="gmail_quote">On Tue, Jan 5, 2010 at 10:37 PM, Dejan Muhamedagic <span dir="ltr"><<a href="mailto:dejanmm@fastmail.fm" target="_blank">dejanmm@fastmail.fm</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hi,<br>
<div><br>
On Tue, Jan 05, 2010 at 09:47:46PM +0200, Angie T. Muhammad wrote:<br>
> mmm, I truncated the logs to re-genrate the error and send you the file, but<br>
> the error no longer appears at /var/log/messages now. There were the words<br>
> "kernel" and "segfault" on the last line !!!<br>
<br>
</div>Did you enabled coredumps (ulimit -c)? Please check<br>
/var/lib/heartbeat/cores/*.<br>
<div><br>
> Any way, I'll try to regenerate the error at /var/log/messages and send it.<br>
> Till then, would you please let me know which files exactly you mean have<br>
> wrong permissions?<br>
<br>
</div>d /var/lib/heartbeat 0755 root root<br>
d /var/lib/pengine 0750 hacluster haclient<br>
d /var/lib/heartbeat/crm 0750 hacluster haclient<br>
d /var/run/crm 0750 hacluster haclient<br>
<br>
Thanks,<br>
<font color="#888888"><br>
Dejan<br>
</font><div><div></div><div><br>
> Thank you<br>
><br>
><br>
><br>
> On Tue, Jan 5, 2010 at 9:29 PM, Dejan Muhamedagic <<a href="mailto:dejanmm@fastmail.fm" target="_blank">dejanmm@fastmail.fm</a>>wrote:<br>
><br>
> > Hi,<br>
> ><br>
> > On Tue, Jan 05, 2010 at 09:19:16PM +0200, Angie T. Muhammad wrote:<br>
> > > Hello all<br>
> > ><br>
> > > Thank you Dejan and Dr. Schwartzkopff<br>
> > > But please bear with me because I'm still suffering a problem. Here is<br>
> > what<br>
> > > I did:<br>
> > ><br>
> > > #  wget -O /etc/yum.repos.d/clusterlabs.repo<br>
> > > <a href="http://clusterlabs.org/rpm/epel-5/clusterlabs.repo" target="_blank">http://clusterlabs.org/rpm/epel-5/clusterlabs.repo</a><br>
> > > # yum install pacemaker pacemaker-libs cluster-glue cluster-glue-libs<br>
> > > resource-agents heartbeat<br>
> > ><br>
> > =============================================================================================================================================================<br>
> > >  Package                                    Arch<br>
> > > Version                               Repository<br>
> > > Size<br>
> > ><br>
> > =============================================================================================================================================================<br>
> > > Installing:<br>
> > >  cluster-glue                               x86_64<br>
> > > 1.0.1-1.el5                           clusterlabs<br>
> > > 262 k<br>
> > >  cluster-glue-libs                          x86_64<br>
> > > 1.0.1-1.el5                           clusterlabs<br>
> > > 130 k<br>
> > >  heartbeat                                  x86_64<br>
> > > 3.0.1-1.el5                           clusterlabs<br>
> > > 193 k<br>
> > >  pacemaker                                  x86_64<br>
> > > 1.0.6-1.el5                           clusterlabs<br>
> > > 689 k<br>
> > >  pacemaker-libs                             x86_64<br>
> > > 1.0.6-1.el5                           clusterlabs<br>
> > > 310 k<br>
> > >  resource-agents                            x86_64<br>
> > > 1.0.1-1.el5                           clusterlabs<br>
> > > 179 k<br>
> > > Installing for dependencies:<br>
> > >  corosync                                   x86_64<br>
> > > 1.1.2-1.el5                           clusterlabs<br>
> > > 163 k<br>
> > >  corosynclib                                x86_64<br>
> > > 1.1.2-1.el5                           clusterlabs<br>
> > > 163 k<br>
> > >  heartbeat-libs                             x86_64<br>
> > > 3.0.1-1.el5                           clusterlabs<br>
> > > 292 k<br>
> > >  libesmtp                                   x86_64<br>
> > > 1.0.4-5.el5                           epel<br>
> > > 60 k<br>
> > >  libibverbs                                 x86_64<br>
> > > 1.1.2-4.el5                           base<br>
> > > 44 k<br>
> > >  librdmacm                                  x86_64<br>
> > > 1.0.8-5.el5                           base<br>
> > > 22 k<br>
> > >  openhpi-libs                               x86_64<br>
> > > 2.14.0-5.el5                          base<br>
> > > 168 k<br>
> > >  openib                                     noarch<br>
> > > 1.4.1-3.el5                           base<br>
> > > 20 k<br>
> > ><br>
> > > Transaction Summary<br>
> > ><br>
> > =============================================================================================================================================================<br>
> > > Install     14 Package(s)<br>
> > > Update       0 Package(s)<br>
> > > Remove       0 Package(s)<br>
> > ><br>
> > > Total download size: 2.6 M<br>
> > ><br>
> > > # vim /etc/ha.d/<a href="http://ha.cf" target="_blank">ha.cf</a><br>
> > > keepalive       2<br>
> > > deadtime        30<br>
> > > warntime        10<br>
> > > initdead        120<br>
> > > udpport         694<br>
> > > ucast eth1      10.0.0.101<br>
> > > auto_failback   on<br>
> > > node            <a href="http://node1.mydomain.com" target="_blank">node1.mydomain.com</a><br>
> > > node            <a href="http://node2.mydomain.com" target="_blank">node2.mydomain.com</a><br>
> > > use_logd        yes<br>
> > ><br>
> > > // and I changed the ucast directive properly for each node<br>
> > ><br>
> > > # vim /etc/ha.d/authkeys<br>
> > > # chmod 600 /etc/ha.d/authkeys<br>
> > > # /etc/init.d/heartbeat start<br>
> > > Starting High-Availability services:                       [  OK  ]<br>
> > > // started properly on both nodes<br>
> > ><br>
> > > # crm_mon -i5<br>
> > > Attempting connection to the cluster....<br>
> > ><br>
> > > # strace -o hb-again crm_mon -i5<br>
> > > // the file is attached<br>
> > ><br>
> > > // I didn't find perl on the system , so I installed it<br>
> > > # yum install perl<br>
> > ><br>
> > > // indeed, i believe the error is at around 92% of the strace output file<br>
> > > when it attempts to:<br>
> > ><br>
> > > connect(3, {sa_family=AF_FILE, path="/var/run/crm/cib_ro"...}, 110) = -1<br>
> > > ENOENT (No such file or directory)<br>
> > > close(3)                                = 0<br>
> > > socket(PF_FILE, SOCK_STREAM, 0)         = 3<br>
> > > fcntl(3, F_GETFL)                       = 0x2 (flags O_RDWR)<br>
> > > fcntl(3, F_SETFL, O_RDWR|O_NONBLOCK)    = 0<br>
> > > connect(3, {sa_family=AF_FILE, path="/var/run/crm/cib_callback"...}, 110)<br>
> > =<br>
> > > -1 ENOENT (No such file or directory)<br>
> ><br>
> > Looks like cib didn't start. The logs should say why. Perhaps<br>
> > there are permission problems?<br>
> ><br>
> > Thanks,<br>
> ><br>
> > Dejan<br>
> ><br>
> > > I can't understand why it can not run :( ..<br>
> > > Version 1.0.5 of pace maker and openais 0.80.5 worked like a charm on the<br>
> > > same nodes.<br>
> > > Now I have to shift to heartbeat because of unicast directive. Please<br>
> > help!<br>
> > ><br>
> > > Thank you in advance<br>
> > ><br>
> > ><br>
> > > On Tue, Jan 5, 2010 at 2:17 PM, Michael Schwartzkopff <<a href="mailto:misch@multinet.de" target="_blank">misch@multinet.de</a><br>
> > >wrote:<br>
> > ><br>
> > > > Am Dienstag, 5. Januar 2010 13:00:44 schrieb Dejan Muhamedagic:<br>
> > > > > Hi,<br>
> > > > ><br>
> > > > > On Tue, Jan 05, 2010 at 01:51:38PM +0200, Angie T. Muhammad wrote:<br>
> > > > > > Hello all,<br>
> > > > > > Hope you spent good time on holidays!<br>
> > > > > ><br>
> > > > > > Our data center does not support multicast and I have been googling<br>
> > > > > > "unicast site:<a href="http://openais.org" target="_blank">openais.org</a>" but now results.<br>
> > > > > > And changing our data center is not an option at the moment.<br>
> > > > > ><br>
> > > > > > I wonder does any beta version of openais support unicast?<br>
> > > > ><br>
> > > > > I think that the latest corosync (1.2.0) supports broadcast.<br>
> > > > ><br>
> > > > > > If not, do you have any link to pacemaker installation with<br>
> > heartbeat<br>
> > > > > > stack?<br>
> > > > ><br>
> > > > > <a href="http://clusterlabs.org" target="_blank">clusterlabs.org</a> has some installation docs and there are also<br>
> > > > > brand new docs at <a href="http://linux-ha.org/wiki/Documentation" target="_blank">http://linux-ha.org/wiki/Documentation</a><br>
> > > > ><br>
> > > > > Thanks,<br>
> > > > ><br>
> > > > > Dejan<br>
> > > > ><br>
> > > > > > Indeed, I would be very grateful if you could suggest me any other<br>
> > > > > > solution?<br>
> > > ><br>
> > > ><br>
> > > > Perhaps you could use a tunnel (gre, ...) to route the multicast.<br>
> > > ><br>
> > > > --<br>
> > > > Dr. Michael Schwartzkopff<br>
> > > > MultiNET Services GmbH<br>
> > > > Addresse: Bretonischer Ring 7; 85630 Grasbrunn; Germany<br>
> > > > Tel: +49 - 89 - 45 69 11 0<br>
> > > > Fax: +49 - 89 - 45 69 11 21<br>
> > > > mob: +49 - 174 - 343 28 75<br>
> > > ><br>
> > > > mail: <a href="mailto:misch@multinet.de" target="_blank">misch@multinet.de</a><br>
> > > > web: <a href="http://www.multinet.de" target="_blank">www.multinet.de</a><br>
> > > ><br>
> > > > Sitz der Gesellschaft: 85630 Grasbrunn<br>
> > > > Registergericht: Amtsgericht München HRB 114375<br>
> > > > Geschäftsführer: Günter Jurgeneit, Hubert Martens<br>
> > > ><br>
> > > > ---<br>
> > > ><br>
> > > > PGP Fingerprint: F919 3919 FF12 ED5A 2801 DEA6 AA77 57A4 EDD8 979B<br>
> > > > Skype: misch42<br>
> > > ><br>
> > > > _______________________________________________<br>
> > > > Pacemaker mailing list<br>
> > > > <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
> > > > <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
> > > ><br>
> > ><br>
> > ><br>
> > ><br>
> > > --<br>
> > > All the best,<br>
> > > Angie<br>
> ><br>
> ><br>
> > > _______________________________________________<br>
> > > Pacemaker mailing list<br>
> > > <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
> > > <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
> ><br>
> ><br>
> > _______________________________________________<br>
> > Pacemaker mailing list<br>
> > <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
> > <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
> ><br>
><br>
><br>
><br>
> --<br>
> All the best,<br>
> Angie<br>
<br>
> _______________________________________________<br>
> Pacemaker mailing list<br>
> <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
> <a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
<br>
<br>
_______________________________________________<br>
Pacemaker mailing list<br>
<a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>
<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/mailman/listinfo/pacemaker</a><br>
</div></div></blockquote></div><br><br clear="all"><br></div></div>-- <br>All the best,<br>Angie<br>
</div>
</blockquote></div><br><br clear="all"><br></div></div>-- <br>All the best,<br>Angie<br>
</div>
</blockquote></div><br><br clear="all"><br>-- <br>All the best,<br>Angie<br>
</div>