<div dir="ltr"><div>Hi Ulrich, thanks for your reply. I realized I didn't give you guys feedback. At the end, that's exactly the route I choose:</div><div><br></div><div>1) first, reinstall the node with same configurations of old node (IPs, hostname, /etc/hosts files, drbd resources files, fencing scripts etc.)</div><div>2) check DRBD configuration, rebuild DRBD volumes, check that both nodes are connected (outside of pacemaker - I'm using drbd service at this stage)</div><div></div><div>3) start pcsd service on new node and execute pcs auth command on both nodes </div><div>4) from the surviving node, remove the old broken node instance</div><div>5) add the new node with all rings addresses  (as in the original cluster creation command)</div><div>6) start pacemaker and corosync services on the new node</div><div>7) profit! (well, sort of...)</div><div><br></div><div>This way all pacemaker configurations have been migrated from the surviving node, and it appears all went well. </div><div>Actually I forgot I had also disabled fencing before starting the procedure, and re-enabled it when all was working again. </div><div><br></div><div>Best regards!</div><div><br></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">Il giorno ven 6 giu 2025 alle ore 08:05 Windl, Ulrich <<a href="mailto:u.windl@ukr.de">u.windl@ukr.de</a>> ha scritto:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg7989345133542467518">





<div lang="DE">
<div class="m_7989345133542467518WordSection1">
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Fabrizio,<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Yes, it’s easier to configure all cluster nodes at once. Years ago I added an extra node to an existing cluster, and it didn’t work as smoothly as expected. Cleanly re-adding
 a node is probably:<u></u><u></u></span></p>
<ol style="margin-top:0cm" start="1" type="1">
<li class="m_7989345133542467518MsoListParagraph" style="color:rgb(31,73,125);margin-left:0cm">
<span lang="EN-US">Cleanly remove a node<u></u><u></u></span></li><li class="m_7989345133542467518MsoListParagraph" style="color:rgb(31,73,125);margin-left:0cm">
<span lang="EN-US">Cleanly add a node<u></u><u></u></span></li></ol>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-family:"Segoe UI Emoji",sans-serif;color:rgb(31,73,125)">😉</span><span lang="EN-US" style="color:rgb(31,73,125)"><u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Kind regards,<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Ulrich Windl<u></u><u></u></span></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"><u></u> <u></u></span></p>
<div style="border-width:medium medium medium 1.5pt;border-style:none none none solid;border-color:currentcolor currentcolor currentcolor blue;padding:0cm 0cm 0cm 4pt">
<div>
<div style="border-width:1pt medium medium;border-style:solid none none;border-color:rgb(225,225,225) currentcolor currentcolor;padding:3pt 0cm 0cm">
<p class="MsoNormal"><b>From:</b> Users <<a href="mailto:users-bounces@clusterlabs.org" target="_blank">users-bounces@clusterlabs.org</a>> <b>On Behalf Of
</b>Fabrizio Ermini<br>
<b>Sent:</b> Monday, May 12, 2025 12:56 PM<br>
<b>To:</b> Cluster Labs - All topics related to open-source clustering welcomed <<a href="mailto:users@clusterlabs.org" target="_blank">users@clusterlabs.org</a>><br>
<b>Subject:</b> [EXT] Re: [ClusterLabs] Rebuild of failed node<u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">Hi Ulrich, and thanks for your reply. In this case, the missing node has been wiped and formatted. Reason wasn't an actual fault, but rather the need to change storage configuration (we had to comply with a security requirement that involved
 adding cryptography at rest of cluster volumes). I intended to use this activity also as a test bed to learn what was the correct procedure to follow in case of a node loss, so that I could be already sure on how to proceed in an emergency. These servers are
 not under backup: they are meant to work as edge servers, collecting data and shipping them up towards main production servers. We have a golden image that allows us to reinstall them quickly, but the installation procedure is based on the assumption that
 both nodes are installed together: at the moment I haven't a procedure to reinstall just one of the nodes, and that's what I'd like to create.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I hope that this can clarify your doubts,  best regards<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Fabrizio<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">Il giorno lun 12 mag 2025 alle ore 08:41 Windl, Ulrich <<a href="mailto:u.windl@ukr.de" target="_blank">u.windl@ukr.de</a>> ha scritto:<u></u><u></u></p>
</div>
<blockquote style="border-width:medium medium medium 1pt;border-style:none none none solid;border-color:currentcolor currentcolor currentcolor rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<div>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Maybe explain what “failed node” and “rebuild” actually means:</span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">It was fenced, or was it reinstalled, or did you have a fatal disk failure?</span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Usually a backup is your best friend.</span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"> </span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Kind regards,</span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)">Ulrich Windl</span><u></u><u></u></p>
<p class="MsoNormal"><span lang="EN-US" style="color:rgb(31,73,125)"> </span><u></u><u></u></p>
<div style="border-width:medium medium medium 1.5pt;border-style:none none none solid;padding:0cm 0cm 0cm 4pt;border-color:currentcolor currentcolor currentcolor blue">
<div>
<div style="border-width:1pt medium medium;border-style:solid none none;padding:3pt 0cm 0cm;border-color:currentcolor">
<p class="MsoNormal"><b>From:</b> Users <<a href="mailto:users-bounces@clusterlabs.org" target="_blank">users-bounces@clusterlabs.org</a>>
<b>On Behalf Of </b>Fabrizio Ermini<br>
<b>Sent:</b> Friday, May 9, 2025 4:26 PM<br>
<b>To:</b> <a href="mailto:users@clusterlabs.org" target="_blank">users@clusterlabs.org</a><br>
<b>Subject:</b> [EXT] [ClusterLabs] Rebuild of failed node<u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"> <u></u><u></u></p>
<div>
<div>
<p class="MsoNormal">Hi all! Freshmen here, just joined.
<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">I'm currently in the need to rebuild a failed node on a pacemaker2.1/corosync3.1 2-node cluster with drbd storage.
<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">I've searched in Pacemaker docs and in the list archives, but I haven't found a clear guide on how to proceed in this task. So far, I've reinstalled a new server, configured the
 same IP and hostname of the failed one, and installed all the software. I've also fixed DRBD layer and started the resync of the volumes. But it's not clear to me how to proceed - I've found some hints online pointing to the need of manually copying corosync
 config, but they were quite old and probably obsolete. I'm using pcs as a shell and I haven't found a command designed to replace a node, only to add or remove them.
<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">It seems really strange to me that there isn't a guide, since this should be a very basic operation and it's quite important to know how to do it - HW breaks, as a matter of fact
 :D<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">So I'll be very grateful if anyone can point me in the right direction.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks in advance, and best regards<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Fabrizio<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
<p class="MsoNormal">_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" target="_blank">https://www.clusterlabs.org/</a><u></u><u></u></p>
</div>
</blockquote>
</div>
</div>
</div>
</div>

_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
</div></blockquote></div></div>