<div dir="ltr"><div><div><div>Hi all,<br></div><br></div>I have 2 nodes, with 2 interfaces each, ETH0 is used for an application, CBC, that's writing to the Postgres DB on the VIP-MASTER 172.28.200.159, ETH1 is used for the Corosync configuration and VIP-REP, everything works, but if the master currently on cl1_lb1 has a catastrophic failure, like power down, the VIPs does not start on the slave, the Postgres parts works fine, cl2_lb1 takes over and acts as a slave, but the VIPs does not come up. If I test it manually, IE kill the application 3 times on the master, the switchover is smooth, same if I kill Postgres on master, but when there is a power failure on the Master, the VIPs stay down. If I then delete the attributes pgsql-data-status="LATEST" and attributes pgsql-data-status="STREAMING|SYNC" on the slave after power off on the master and restart everything, then the VIPs come up on the slave, any ideas please?<br></div>I'm using this setup<br><a href="http://clusterlabs.org/wiki/PgSQL_Replicated_Cluster">http://clusterlabs.org/wiki/PgSQL_Replicated_Cluster</a><br><div><div><br>With this configuration below<br>node cl1_lb1 \<br>        attributes pgsql-data-status="LATEST"<br>node cl2_lb1 \<br>        attributes pgsql-data-status="STREAMING|SYNC"<br>primitive CBC_instance ocf:heartbeat:cbc \<br>        op monitor interval="60s" timeout="60s" on-fail="restart" \<br>        op start interval="0s" timeout="60s" on-fail="restart" \<br>        meta target-role="Started" migration-threshold="3" failure-timeout="60s"<br>primitive failover_MailTo ocf:heartbeat:MailTo \<br>        params email="<a href="mailto:wynandj@rorotika.com">wynandj@rorotika.com</a>" subject="Cluster Status change - " \<br>        op monitor interval="10" timeout="10" dept="0"<br>primitive pgsql ocf:heartbeat:pgsql \<br>        params pgctl="/opt/app/PostgreSQL/9.3/bin/pg_ctl" psql="/opt/app/PostgreSQL/9.3/bin/psql" config="/opt/app/pgdata/9.3/postgresql.conf" pgdba="postgres" pgdata="/opt/app/pgdata/9.3/" start_opt="-p 5432" rep_mode="sync" node_list="cl1_lb1 cl2_lb1" restore_command="cp /pgtablespace/archive/%f %p" primary_conninfo_opt="keepalives_idle=60 keepalives_interval=5 keepalives_count=5" master_ip="172.16.0.5" restart_on_promote="false" logfile="/var/log/OCF.log" \<br>        op start interval="0s" timeout="60s" on-fail="restart" \<br>        op monitor interval="4s" timeout="60s" on-fail="restart" \<br>        op monitor interval="3s" role="Master" timeout="60s" on-fail="restart" \<br>        op promote interval="0s" timeout="60s" on-fail="restart" \<br>        op demote interval="0s" timeout="60s" on-fail="stop" \<br>        op stop interval="0s" timeout="60s" on-fail="block" \<br>        op notify interval="0s" timeout="60s"<br>primitive vip-master ocf:heartbeat:IPaddr2 \<br>        params ip="172.28.200.159" nic="eth0" iflabel="CBC_VIP" cidr_netmask="24" \<br>        op start interval="0s" timeout="60s" on-fail="restart" \<br>        op monitor interval="10s" timeout="60s" on-fail="restart" \<br>        op stop interval="0s" timeout="60s" on-fail="block" \<br>        meta target-role="Started"<br>primitive vip-rep ocf:heartbeat:IPaddr2 \<br>        params ip="172.16.0.5" nic="eth1" iflabel="REP_VIP" cidr_netmask="24" \<br>        meta migration-threshold="0" target-role="Started" \<br>        op start interval="0s" timeout="60s" on-fail="stop" \<br>        op monitor interval="10s" timeout="60s" on-fail="restart" \<br>        op stop interval="0s" timeout="60s" on-fail="restart"<br>group master-group vip-master vip-rep CBC_instance failover_MailTo<br>ms msPostgresql pgsql \<br>        meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"<br>colocation rsc_colocation-1 inf: master-group msPostgresql:Master<br>order rsc_order-1 0: msPostgresql:promote master-group:start symmetrical=false<br>order rsc_order-2 0: msPostgresql:demote master-group:stop symmetrical=false<br>property $id="cib-bootstrap-options" \<br>        dc-version="1.1.9-2db99f1" \<br>        cluster-infrastructure="classic openais (with plugin)" \<br>        expected-quorum-votes="2" \<br>        no-quorum-policy="ignore" \<br>        stonith-enabled="false" \<br>        cluster-recheck-interval="1min" \<br>        crmd-transition-delay="0s" \<br>        last-lrm-refresh="1426485983"<br>        rsc_defaults $id="rsc-options" \<br>        resource-stickiness="INFINITY" \<br>        migration-threshold="1"<br>#vim:set syntax=pcmk<br><br></div><div>Any ideas please, I'm lost......<br><br></div></div></div>