Hey Ken,<div id="yMail_cursorElementTracker_1632762732029"><br></div><div id="yMail_cursorElementTracker_1632762732262">how should someone set the maintenace via pcs ?</div><div id="yMail_cursorElementTracker_1632762761764"><br></div><div id="yMail_cursorElementTracker_1632762761987">Best Regards,</div><div id="yMail_cursorElementTracker_1632762765969">Strahil Nikolov<br> <br> <blockquote style="margin: 0 0 20px 0;"> <div style="font-family:Roboto, sans-serif; color:#6D00F6;"> <div>On Mon, Sep 27, 2021 at 19:56, Ken Gaillot</div><div><kgaillot@redhat.com> wrote:</div> </div> <div style="padding: 10px 0 0 20px; margin: 10px 0 0 0; border-left: 1px solid #6D00F6;"> On Mon, 2021-09-27 at 12:37 +0200, Lentes, Bernd wrote:<br clear="none">> Hi,<br clear="none">> <br clear="none">> i have a two-node cluster running on SLES 12SP5 with two HP servers<br clear="none">> and a common FC SAN.<br clear="none">> Most of my resources are virtual domains offering databases and web<br clear="none">> pages.<br clear="none">> The disks from the domains reside on a OCFS2 Volume on a FC SAN.<br clear="none">> Each night a 9pm all domains are snapshotted with the OCFS2 tool<br clear="none">> reflink.<br clear="none">> After the snapshot is created the disks of the domains are copied to<br clear="none">> a NAS, domains are still running.<br clear="none">> The copy procedure occupies the CPU and IO intensively. IO is<br clear="none">> occupied by copy about 90%, the CPU has sometimes a wait about 50%.<br clear="none">> Because of that the domains aren't responsive, so that the monitor<br clear="none">> operation from the RA fails sometimes.<br clear="none">> In worst cases one domain is fenced.<br clear="none">> What would you do in such a situation ?<br clear="none">> I'm thinking of making the cp procedure nicer, with nice. Maybe about<br clear="none">> 10.<br clear="none">> <br clear="none">> More ideas ?<br clear="none">> <br clear="none">> <br clear="none">> Bernd<br clear="none"><br clear="none">This is a classic use case for rules:<br clear="none"><br clear="none"><a shape="rect" href="https://clusterlabs.org/pacemaker/doc/2.1/Pacemaker_Explained/singlehtml/index.html#using-rules-to-control-cluster-options" target="_blank">https://clusterlabs.org/pacemaker/doc/2.1/Pacemaker_Explained/singlehtml/index.html#using-rules-to-control-cluster-options</a><br clear="none"><br clear="none">You can put the cluster into maintenance mode for the window, or<br clear="none">disable the monitor for the window. Of course that also disables any<br clear="none">cluster response. You could instead lengthen operation timeouts during<br clear="none">the window.<br clear="none">-- <br clear="none">Ken Gaillot <<a shape="rect" ymailto="mailto:kgaillot@redhat.com" href="mailto:kgaillot@redhat.com">kgaillot@redhat.com</a>><div class="yqt8283492838" id="yqtfd71406"><br clear="none"><br clear="none">_______________________________________________<br clear="none">Manage your subscription:<br clear="none"><a shape="rect" href="https://lists.clusterlabs.org/mailman/listinfo/users" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br clear="none"><br clear="none">ClusterLabs home: <a shape="rect" href="https://www.clusterlabs.org/" target="_blank">https://www.clusterlabs.org/</a><br clear="none"></div> </div> </blockquote></div>