Hi Guys,<div><br></div><div>I had a perfectly running system for about 3 weeks now but now on reboot I see problems.</div><div><br></div><div>Looks like the processes are being spawned and respawned but a proper exec is not happening.</div>
<div>Am I missing some permissions on directories.</div><div><br></div><div><br></div><div>I have a script which does the following for directories:</div><div>=============</div><div><div>getent group haclient > /dev/null || groupadd -r haclient</div>
<div>getent passwd hacluster > /dev/null || useradd -r -g haclient -d /var/lib/heartbeat/cores/hacluster -s /sbin/nologin -c "cluster user" hacluster</div><div><br></div><div>if [ ! -d "/var/lib/pengine" ];then</div>
<div> mkdir /var/lib/pengine</div><div>fi</div><div>chown -R hacluster:haclient /var/lib/pengine</div><div><br></div><div>if [ ! -d "/var/lib/heartbeat" ];then</div><div><span class="Apple-tab-span" style="white-space:pre">     </span>mkdir /var/lib/heartbeat</div>
<div>fi</div><div><br></div><div>if [ ! -d "/var/lib/heartbeat/crm" ];then</div><div> mkdir /var/lib/heartbeat/crm</div><div>fi</div><div>chown -R hacluster:haclient /var/lib/heartbeat/crm/</div><div>chmod 750 /var/lib/heartbeat/crm/</div>
<div><br></div><div>if [ ! -d "/var/lib/heartbeat/ccm" ];then</div><div> mkdir /var/lib/heartbeat/ccm</div><div>fi</div><div>chown -R hacluster:haclient /var/lib/heartbeat/ccm/</div><div>chmod 750 /var/lib/heartbeat/ccm/</div>
<div><br></div><div>if [ ! -d "/var/run/heartbeat/" ];then</div><div> mkdir /var/run/heartbeat/</div><div> fi</div><div><br></div><div>if [ ! -d "/var/run/heartbeat/ccm" ];then</div><div> mkdir /var/run/heartbeat/ccm/</div>
<div> fi</div><div>chown -R hacluster:haclient /var/run/heartbeat/ccm/</div><div>chmod 750 /var/run/heartbeat/ccm/</div><div><br></div><div>if [ ! -d "/var/run/heartbeat/crm" ];then</div><div> mkdir /var/run/heartbeat/crm/</div>
<div> fi</div><div>chown -R hacluster:haclient /var/run/heartbeat/crm/</div><div>chmod 750 /var/run/heartbeat/crm/</div><div><br></div><div>if [ ! -d "/var/run/crm" ];then</div><div> mkdir /var/run/crm</div><div>
fi</div><div> </div><div>if [ ! -d "/var/lib/corosync" ];then</div><div> mkdir /var/lib/corosync</div><div>fi</div><div>=============</div></div><div><br></div><div><br></div><div>I have a very simple active-passive configuration with just 2 nodes.</div>
<div><br></div><div>On starting Corosync , on doing</div><div><br></div><div><br></div><div><div>[root@node2 ~]# ps -ef | grep coro</div><div>root      8242     1  0 11:33 ?        00:00:00 /usr/sbin/corosync</div><div>root      8248  8242  0 11:33 ?        00:00:00 /usr/sbin/corosync</div>
<div>root      8249  8242  0 11:33 ?        00:00:00 /usr/sbin/corosync</div><div>root      8250  8242  0 11:33 ?        00:00:00 /usr/sbin/corosync</div><div>root      8252  8242  0 11:33 ?        00:00:00 /usr/sbin/corosync</div>
<div>root      8393  8242  0 11:35 ?        00:00:00 /usr/sbin/corosync</div><div><div>[root@node2 ~]# ps -ef | grep heart</div><div>82        7924     1  0 11:28 ?        00:00:00 /usr/lib64/heartbeat/pengine</div><div><br>
</div><div>I'm attaching the log file.</div><div><br></div><div>My config is:</div><div><br></div><div><br></div><div><div># Please read the corosync.conf.5 manual page</div><div>compatibility: whitetank</div><div><br>
</div><div>totem {</div><div> version: 2</div><div>  token: 3000</div><div>  token_retransmits_before_loss_const: 10</div><div>  join: 60</div><div>  consensus: 1500</div><div>  vsftype: none</div><div>  max_messages: 20</div>
<div>  clear_node_high_bit: yes</div><div>  secauth: on</div><div>  threads: 0</div><div>  rrp_mode: passive</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>interface {</div><div><span class="Apple-tab-span" style="white-space:pre">          </span>ringnumber: 0</div>
<div><span class="Apple-tab-span" style="white-space:pre">              </span>bindnetaddr: 192.168.1.0</div><div>#<span class="Apple-tab-span" style="white-space:pre">            </span>mcastaddr: 226.94.1.1</div><div><span class="Apple-tab-span" style="white-space:pre">                </span>broadcast: yes</div>
<div><span class="Apple-tab-span" style="white-space:pre">              </span>mcastport: 5405</div><div><span class="Apple-tab-span" style="white-space:pre">      </span>}</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>interface {</div>
<div><span class="Apple-tab-span" style="white-space:pre">              </span>ringnumber: 1</div><div><span class="Apple-tab-span" style="white-space:pre">                </span>bindnetaddr: 172.20.20.0</div><div>#<span class="Apple-tab-span" style="white-space:pre">            </span>mcastaddr: 226.94.1.1</div>
<div><span class="Apple-tab-span" style="white-space:pre">              </span>broadcast: yes</div><div><span class="Apple-tab-span" style="white-space:pre">               </span>mcastport: 5405</div><div><span class="Apple-tab-span" style="white-space:pre">      </span>}</div>
<div>}</div><div><br></div><div>logging {</div><div><span class="Apple-tab-span" style="white-space:pre">     </span>fileline: off</div><div><span class="Apple-tab-span" style="white-space:pre">        </span>to_stderr: yes</div><div>
<span class="Apple-tab-span" style="white-space:pre"> </span>to_logfile: yes</div><div><span class="Apple-tab-span" style="white-space:pre">      </span>to_syslog: yes</div><div><span class="Apple-tab-span" style="white-space:pre">       </span>logfile: /tmp/corosync.log</div>
<div><span class="Apple-tab-span" style="white-space:pre">      </span>debug: on</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>timestamp: on</div><div><span class="Apple-tab-span" style="white-space:pre">        </span>logger_subsys {</div>
<div><span class="Apple-tab-span" style="white-space:pre">              </span>subsys: AMF</div><div><span class="Apple-tab-span" style="white-space:pre">          </span>debug: off</div><div><span class="Apple-tab-span" style="white-space:pre">   </span>}</div>
<div>}</div><div><br></div><div>service {</div><div><span class="Apple-tab-span" style="white-space:pre">     </span>name: pacemaker</div><div><span class="Apple-tab-span" style="white-space:pre">      </span>ver: 0 </div><div>}</div>
<div><br></div><div>aisexec {</div><div><span class="Apple-tab-span" style="white-space:pre">     </span>user:root</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>group: root</div><div>}</div><div><br></div>
<div>amf {</div><div><span class="Apple-tab-span" style="white-space:pre">  </span>mode: disabled</div><div>}</div><div><br></div></div><div><br></div></div><div><div>Please help.</div><div><br></div><div>Sincerely</div><div>
Shravan</div><div><br></div><div><br></div><div><br></div></div></div>