<div dir="ltr"><div><div><div><div><div><div><div><div><div><div>Hi all,<br><br></div>I searched online but couldn't find a detailed answer. OS is RHEL 6.5.<br><br></div><div>Problem:<br></div><div>I have 2 servers which was setup fine (MySQL cluster is on it, DRBD for the data disk on local disk) on which these 2 servers needs to be migrated to other location. When it was migrated, the DRBD has to change from local disk to SAN LUN which was migrated ok but the cluster began experiencing weird behavior. Then the 2 nodes are shutdown and booted together, each server can see each other as online via "crm_mon -1" but when one of the node's pacemaker process is restarted, the status of that node from the other node stays offline/stopped, even if I reboot that node, it doesn't join back the cluster.<br><br></div><div>Other observation - if these 2 servers boot up together, both see online as above and when I stop pacemaker process on the Active node, the other node takes over the resources which is good but even if I start back the pacemaker process on the other node, it's not able to take back the resources. Kind of like, only one failover can happen and cannot failback.<br><br></div><div><br></div>What I did:<br></div>I removed Pacemaker and Corosync via YUM<br></div>Rebooted the OS<br></div>Verified no more Pacemaker/Corosync packages<br></div>Installed back Pacemaker and Corosync via YUM<br></div>When I did "crm_mon -1", I'm surprised to see that configuration is still there.<br><br></div><div>After the reinstallation, still experiencing the same behavior and noticed that DRBD is reporting Failed disk - only a reboot of the node can bring it back to UpToDate.<br><br></div>Please advise on the correct procedure to wipe out the configuration and reinstallation.<br><br></div><div>I will share the logs shortly.<br></div><div><br></div>Thanks,<br></div>Jef<br></div>