<div dir="ltr">It seems that I didnt uninstall my ovn environment properly. It get started after I uninstall my ovn and delete /var/lib/ovn directory.<div><br></div><div>But I get another issue, ovn state is started on pacemaker but when I checked via systemd there is no ovn/ovsdb started.</div><div><br></div><div>1. Pacemaker status</div><div>```</div><div>Full list of resources:<br><br> internal_vip       (ocf::heartbeat:IPaddr2):       Started ag-controller2<br> public_vip    (ocf::heartbeat:IPaddr2):       Started ag-controller2<br> Clone Set: lb-haproxy-clone [lb-haproxy]<br>     Started: [ ag-controller2 ]<br>     Stopped: [ ag-controller0 ag-controller1 ]<br> Clone Set: wsgi-keystone-clone [wsgi-keystone]<br>     Started: [ ag-controller0 ag-controller1 ag-controller2 ]<br> Master/Slave Set: ovndb_servers-master [ovndb_servers]<br>     Masters: [ ag-controller2 ]<br>     Slaves: [ ag-controller0 ag-controller1 ]<br></div><div>```</div><div><br></div><div>2. Debug</div><div>```</div><div>instructor@ag-controller2:~$ sudo crm_resource --why -r ovndb_servers<br>Resource ovndb_servers:0 is running<br></div><div><br></div><div>instructor@ag-controller2:~$ sudo pcs resource unmanage ovndb_servers-master<br>instructor@ag-controller2:~$ sudo pcs resource debug-start ovndb_servers --full<br>Operation start for ovndb_servers:0 (ocf:ovn:ovndb-servers) returned: 'master' (8)</div><div>```</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Sep 4, 2020 at 12:08 AM Ken Gaillot <<a href="mailto:kgaillot@redhat.com">kgaillot@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On Thu, 2020-09-03 at 23:10 +0700, Popoi Zen wrote:<br>
> Hi, I try to create ovn cluster using ovndb-servers resource agent<br>
> from Pacemaker but it get error and failed.<br>
> <br>
> ```<br>
> instructor@ag-controller0:~$ sudo pcs status<br>
> Cluster name: os-ha<br>
> Stack: corosync<br>
> Current DC: ag-controller2 (version 1.1.18-2b07d5c5a9) - partition<br>
> with quorum<br>
> Last updated: Thu Sep  3 23:01:03 2020<br>
> Last change: Thu Sep  3 22:58:13 2020 by root via cibadmin on ag-<br>
> controller0<br>
> <br>
> 3 nodes configured<br>
> 8 resources configured<br>
> <br>
> Online: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> <br>
> Full list of resources:<br>
> <br>
>  internal_vip (ocf::heartbeat:IPaddr2):       Started ag-controller0<br>
>  public_vip   (ocf::heartbeat:IPaddr2):       Started ag-controller0<br>
>  Clone Set: lb-haproxy-clone [lb-haproxy]<br>
>      Started: [ ag-controller0 ]<br>
>      Stopped: [ ag-controller1 ag-controller2 ]<br>
>  Clone Set: wsgi-keystone-clone [wsgi-keystone]<br>
>      Started: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> <br>
> Daemon Status:<br>
>   corosync: active/enabled<br>
>   pacemaker: active/enabled<br>
>   pcsd: active/enabled<br>
> ```<br>
> <br>
> I am using this guide <br>
> <a href="https://docs.openvswitch.org/en/latest/topics/integration/" rel="noreferrer" target="_blank">https://docs.openvswitch.org/en/latest/topics/integration/</a>.<br>
> <br>
> 1. Modify it resource agent symlink to the right path.<br>
> instructor@ag-controller0:~$ ll /usr/lib/ocf/resource.d/ovn/ovndb-<br>
> servers<br>
> lrwxrwxrwx 1 root root 40 Sep  3 22:26<br>
> /usr/lib/ocf/resource.d/ovn/ovndb-servers -><br>
> /usr/share/ovn/scripts/ovndb-servers.ocf*<br>
> <br>
> 2. Create ovndb_servers resource<br>
> instructor@ag-controller0:~$ sudo pcs resource create ovndb_servers<br>
> ocf:ovn:ovndb-servers master_ip=10.50.50.100<br>
> ovn_ctl=/usr/share/ovn/scripts/ovn-ctl op monitor interval="10s" op<br>
> monitor role=Master interval="15s"<br>
> instructor@ag-controller0:~$ sudo pcs resource master ovndb_servers-<br>
> master ovndb_servers meta notify="true"<br>
> <br>
> 3.  Create contraint<br>
> sudo pcs constraint order promote ovndb_servers-master then<br>
> internal_vip<br>
> <br>
> 4. Check status, ovndb still on stopped status<br>
> ```<br>
> Online: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> <br>
> Full list of resources:<br>
> <br>
>  internal_vip (ocf::heartbeat:IPaddr2):       Started ag-controller0<br>
>  public_vip   (ocf::heartbeat:IPaddr2):       Started ag-controller0<br>
>  Clone Set: lb-haproxy-clone [lb-haproxy]<br>
>      Started: [ ag-controller0 ]<br>
>      Stopped: [ ag-controller1 ag-controller2 ]<br>
>  Clone Set: wsgi-keystone-clone [wsgi-keystone]<br>
>      Started: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
>  Master/Slave Set: ovndb_servers-master [ovndb_servers]<br>
>      Stopped: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> <br>
> Daemon Status:<br>
>   corosync: active/enabled<br>
>   pacemaker: active/enabled<br>
>   pcsd: active/enabled<br>
> ```<br>
> 5. Create collocation<br>
> sudo pcs constraint colocation add internal_vip with master<br>
> ovndb_servers-master score=INFINITY<br>
> <br>
> 6. Check my pacemaker status again, my VIP resource and ovndb_servers<br>
> stopped.<br>
> ```<br>
> Online: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> <br>
> Full list of resources:<br>
> <br>
>  internal_vip (ocf::heartbeat:IPaddr2):       Stopped<br>
>  public_vip   (ocf::heartbeat:IPaddr2):       Stopped<br>
>  Clone Set: lb-haproxy-clone [lb-haproxy]<br>
>      Stopped: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
>  Clone Set: wsgi-keystone-clone [wsgi-keystone]<br>
>      Started: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
>  Master/Slave Set: ovndb_servers-master [ovndb_servers]<br>
>      Stopped: [ ag-controller0 ag-controller1 ag-controller2 ]<br>
> ```<br>
> <br>
> <br>
> Is there any working guide that works? Or I miss something on my<br>
> configuration?<br>
> <br>
> <br>
> Regards<br>
<br>
Check the system log and pacemaker detail log for errors. You can also<br>
try "crm_resource --why -r ovndb_servers" to see if there's an obvious<br>
reason it's stopped. If none of that helps, try "pcs resource debug-<br>
start ovndb_servers --full" on one node to see if that gives additional<br>
info (that will launch the resource outside pacemaker's control, so<br>
it's a good idea to unmanage it in pacemaker first). <br>
-- <br>
Ken Gaillot <<a href="mailto:kgaillot@redhat.com" target="_blank">kgaillot@redhat.com</a>><br>
<br>
_______________________________________________<br>
Manage your subscription:<br>
<a href="https://lists.clusterlabs.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.clusterlabs.org/mailman/listinfo/users</a><br>
<br>
ClusterLabs home: <a href="https://www.clusterlabs.org/" rel="noreferrer" target="_blank">https://www.clusterlabs.org/</a><br>
</blockquote></div>