]> git.apps.os.sepia.ceph.com Git - ceph-ansible.git/commit
ceph-handler: Fix rgw socket in restart script
authorDimitri Savineau <dsavinea@redhat.com>
Tue, 7 May 2019 20:33:21 +0000 (16:33 -0400)
committermergify[bot] <37929162+mergify[bot]@users.noreply.github.com>
Wed, 3 Jul 2019 15:08:35 +0000 (15:08 +0000)
commitd4a3e26534334cdbb9111fca3c430b3b2913885a
tree8f501f65cc232e94a182ebd698ceb2a1e9f2289c
parent72e0ac1f44cb3586377618ac78a0cd5862e0fdcd
ceph-handler: Fix rgw socket in restart script

Since Mimic the radosgw socket has two extra fields in the socket
name (before the .asok suffix): <pid>.<ctid>

Before:
  /var/run/ceph/ceph-client.rgw.cephaio-1.asok
After:
  /var/run/ceph/ceph-client.rgw.cephaio-1.16913.23928832.asok

The radosgw restart script doesn't handle this and could fail during
an upgrade.
If the SOCKETS variable isn't defined in the script then the test
command won't fail because the return code is 0

$ test -S
$ echo $?
0

There multiple issues in that script:
  - The default SOCKETS value isn't defined due to a typo
SOCKET vs SOCKETS.
  - Because the socket name uses the pid then we need to check the
socket name after the service restart.
  - After restarting the radosgw service we need to wait few seconds
otherwise the socket won't be created.
  - Update the wget parameters because the command is doing a loop.
We now use the same option than curl.
  - The check_rest function doesn't test the radosgw at all due to
a wrong test command (test against a string) and always returns 0.
This needs to use the DOCKER_EXECS variable in order to execute the
command.

$ test 'wget http://192.168.100.11:8080'
$ echo $?
0

Also remove the test based on the ansible_fqdn because we only use
the ansible_hostname + rgw instance name.

Finally group all for loop into a single one.

Resolves: #3926

Signed-off-by: Dimitri Savineau <dsavinea@redhat.com>
(cherry picked from commit c90f605b5148d179790cec545d02db1086579994)
roles/ceph-handler/templates/restart_rgw_daemon.sh.j2