<div dir="ltr">Hi!<div>thanks for help .. anyway - my slave node is still async, event the select you mentioned shows async .. at least i found out, that if i set rep_mode to "async", the slave node gets promoted when master fails ... </div>

<div>so right now it is working, but i would like still know how to make streaming replication synchronous .. i did everything as in mentioned wiki page, but it is still async</div><div>any idea?</div><div>Thanks</div><div>

Tomas</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2014/1/14 東一彦 <span dir="ltr"><<a href="mailto:higashi.kazuhiko@lab.ntt.co.jp" target="_blank">higashi.kazuhiko@lab.ntt.co.jp</a>></span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<div class="im"><br>

<br>

> but after some tests something went wrong and i don't know what and why and how to get it back working ... now when i start crm, master is PRI, but slave gets into HS:ASYNC state .. and when master fails, and slave gets into HS:alone state<br>

</div>

It is PostgreSQL to select the node whether "sync" or "async".<br>

pgsql RA displays a result of the following SQL.<br>

<br>

  select application_name,upper(state),<u></u>upper(sync_state) from pg_stat_replication;<br>

<br>

So, at first, please watch PostgreSQL's log.<br>

<br>

<br>

<br>

Possibly the data may become inconsistent.<br>

You can resolve the inconsistency in the following operation.<br>

<br>

 <a href="http://clusterlabs.org/wiki/PgSQL_Replicated_Cluster#after_fail-over" target="_blank">http://clusterlabs.org/wiki/<u></u>PgSQL_Replicated_Cluster#<u></u>after_fail-over</a><br>

<br>

<br>

Regards,<br>

Kazuhiko HIGASHI<div><div class="h5"><br>

<br>

(2014/01/10 17:48), Tomáš Vajrauch wrote:<br>

</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5">

Hi,<br>

<br>

i am trying to run postgresql cluster with streaming replication using pgsql RA and pacemaker ..<br>

i succeded once, master was as PRI, slave HS:sync, failover worked as it should (slave become master) ..<br>

but after some tests something went wrong and i don't know what and why and how to get it back working ... now when i start crm, master is PRI, but slave gets into HS:ASYNC state .. and when master fails, and slave gets into HS:alone state<br>


<br>

can somebody please give me hint what should i do or what should i look for?<br>

<br>

Thanks a lot for any help<br>

Tomas<br>

<br>

my configuration:<br>

<br>

node jboss-test \<br>

         attributes pgsql-data-status="LATEST"<br>

node jboss-test2 \<br>

         attributes pgsql-data-status="STREAMING|<u></u>ASYNC"<br>

primitive pgsql ocf:heartbeat:pgsql \<br>

         params pgctl="/opt/postgres/9.3/bin/<u></u>pg_ctl" psql="/opt/postgres/9.3/bin/<u></u>psql" pgdata="/opt/postgres/9.3/<u></u>data/" rep_mode="sync" node_list="jboss-test jboss-test2" restore_command="cp /opt/postgres/9.3/data/pg_<u></u>archive/%f %p" primary_conninfo_opt="<u></u>keepalives_idle=60 keepalives_interval=5 keepalives_count=5" master_ip="172.16.111.120" stop_escalate="0" \<br>


         op start interval="0s" timeout="60s" on-fail="restart" \<br>

         op stop interval="0s" timeout="60s" on-fail="block" \<br>

         op monitor interval="11s" timeout="60s" on-fail="restart" \<br>

         op monitor interval="10s" role="Master" timeout="60s" on-fail="restart" \<br>

         op promote interval="0s" timeout="60s" on-fail="restart" \<br>

         op demote interval="0s" timeout="60s" on-fail="block" \<br>

         op notify interval="0s" timeout="60s"<br>

primitive pingCheck ocf:pacemaker:ping \<br>

         params name="default_ping_set" host_list="172.16.0.1" multiplier="100" \<br>

         op start interval="0s" timeout="60s" on-fail="restart" \<br>

         op monitor interval="2s" timeout="60s" on-fail="restart" \<br>

         op stop interval="0s" timeout="60s" on-fail="ignore"<br>

primitive vip-master ocf:heartbeat:IPaddr2 \<br>

         params ip="172.16.111.110" nic="eth0" cidr_netmask="24" \<br>

         op start interval="0s" timeout="60s" on-fail="restart" \<br>

         op monitor interval="10s" timeout="60s" on-fail="restart" \<br>

         op stop interval="0s" timeout="60s" on-fail="block"<br>

primitive vip-rep ocf:heartbeat:IPaddr2 \<br>

         params ip="172.16.111.120" nic="eth0" cidr_netmask="24" \<br>

         meta migration-threshold="0" \<br>

         op start interval="0s" timeout="60s" on-fail="stop" \<br>

         op monitor interval="10s" timeout="60s" on-fail="restart" \<br>

         op stop interval="0s" timeout="60s" on-fail="block"<br>

primitive vip-slave ocf:heartbeat:IPaddr2 \<br>

         params ip="172.16.111.111" nic="eth0" cidr_netmask="24" \<br>

         meta resource-stickiness="1" \<br>

         op start interval="0s" timeout="60s" on-fail="restart" \<br>

         op monitor interval="10s" timeout="60s" on-fail="restart" \<br>

         op stop interval="0s" timeout="60s" on-fail="block"<br>

group master-group vip-master vip-rep \<br>

         meta ordered="false"<br>

ms msPostgresql pgsql \<br>

         meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"<br>

clone clnPingCheck pingCheck<br>

location rsc_location-1 vip-slave \<br>

         rule $id="rsc_location-1-rule" 200: pgsql-status eq HS:sync \<br>

         rule $id="rsc_location-1-rule-0" 190: pgsql-status eq HS:async \<br>

         rule $id="rsc_location-1-rule-1" 100: pgsql-status eq PRI \<br>

         rule $id="rsc_location-1-rule-2" -inf: not_defined pgsql-status \<br>

         rule $id="rsc_location-1-rule-3" -inf: pgsql-status ne HS:sync and pgsql-status ne PRI and pgsql-status ne HS:async<br>

location rsc_location-2 msPostgresql \<br>

         rule $id="rsc_location-3-rule" -inf: not_defined default_ping_set or default_ping_set lt 100<br>

colocation rsc_colocation-1 inf: msPostgresql clnPingCheck<br>

colocation rsc_colocation-2 inf: master-group msPostgresql:Master<br>

order rsc_order-1 0: clnPingCheck msPostgresql<br>

order rsc_order-2 0: msPostgresql:promote master-group:start symmetrical=false<br>

order rsc_order-3 0: msPostgresql:demote master-group:stop symmetrical=false<br>

property $id="cib-bootstrap-options" \<br>

         no-quorum-policy="ignore" \<br>

         stonith-enabled="false" \<br>

         crmd-transition-delay="0s" \<br>

         dc-version="1.1.6-<u></u>9971ebba4494012a93c03b40a2c58e<u></u>c0eb60f50c" \<br>

         cluster-infrastructure="<u></u>openais" \<br>

         expected-quorum-votes="2" \<br>

         last-lrm-refresh="1389301940"<br>

rsc_defaults $id="rsc-options" \<br>

         resource-stickiness="INFINITY" \<br>

         migration-threshold="1"<br>

<br>

crm_mon -Afr:<br>

============<br>

Last updated: Fri Jan 10 09:46:29 2014<br>

Last change: Fri Jan 10 09:46:29 2014 by root via crm_attribute on jboss-test<br>

Stack: openais<br>

Current DC: jboss-test - partition with quorum<br>

Version: 1.1.6-<u></u>9971ebba4494012a93c03b40a2c58e<u></u>c0eb60f50c<br>

2 Nodes configured, 2 expected votes<br>

7 Resources configured.<br>

============<br>

<br>

Online: [ jboss-test jboss-test2 ]<br>

<br>

Full list of resources:<br>

<br>

  Clone Set: clnPingCheck [pingCheck]<br>

      Started: [ jboss-test jboss-test2 ]<br>

  Master/Slave Set: msPostgresql [pgsql]<br>

      Masters: [ jboss-test ]<br>

      Slaves: [ jboss-test2 ]<br>

vip-slave       (ocf::heartbeat:IPaddr2):       Started jboss-test2<br>

  Resource Group: master-group<br>

      vip-master (ocf::heartbeat:IPaddr2):       Started jboss-test<br>

      vip-rep    (ocf::heartbeat:IPaddr2):       Started jboss-test<br>

<br>

Node Attributes:<br>

* Node jboss-test:<br>

     + default_ping_set                  : 100<br>

     + master-pgsql:0                    : 1000<br>

     + pgsql-data-status                 : LATEST<br>

     + pgsql-master-baseline             : 0000000039004DF0<br>

     + pgsql-status                      : PRI<br>

* Node jboss-test2:<br>

     + default_ping_set                  : 100<br>

     + master-pgsql:1                    : -INFINITY<br>

     + pgsql-data-status                 : STREAMING|ASYNC<br>

     + pgsql-status                      : HS:async<br>

<br>

<br>

<br></div></div>

______________________________<u></u>_________________<br>

Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>

<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/<u></u>mailman/listinfo/pacemaker</a><br>

<br>

Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>

Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/<u></u>doc/Cluster_from_Scratch.pdf</a><br>

Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>

<br>

</blockquote>

<br>

<br>

-- <br>

------------------------------<u></u>----------------------<br>

 東 一彦<br>

  NTT OSSセンタ 基盤技術ユニット 高信頼担当<br>

  (SV総研 ソフトウェアイノベーションセンタ OSS推進PJ)<br>

 <a href="mailto:Mail%3Ahigashi.kazuhiko@lab.ntt.co.jp" target="_blank">Mail:higashi.kazuhiko@lab.ntt.<u></u>co.jp</a><br>

 Tel :03-5860-5135<br>

 〒108-8019 東京都港区港南1-9-1 NTT品川TWINSビル11階<br>

------------------------------<u></u>----------------------<br>

<br>

______________________________<u></u>_________________<br>

Pacemaker mailing list: <a href="mailto:Pacemaker@oss.clusterlabs.org" target="_blank">Pacemaker@oss.clusterlabs.org</a><br>

<a href="http://oss.clusterlabs.org/mailman/listinfo/pacemaker" target="_blank">http://oss.clusterlabs.org/<u></u>mailman/listinfo/pacemaker</a><br>

<br>

Project Home: <a href="http://www.clusterlabs.org" target="_blank">http://www.clusterlabs.org</a><br>

Getting started: <a href="http://www.clusterlabs.org/doc/Cluster_from_Scratch.pdf" target="_blank">http://www.clusterlabs.org/<u></u>doc/Cluster_from_Scratch.pdf</a><br>

Bugs: <a href="http://bugs.clusterlabs.org" target="_blank">http://bugs.clusterlabs.org</a><br>

</blockquote></div><br></div>