]> git-server-git.apps.pok.os.sepia.ceph.com Git - ceph.git/commit
cephadm: wait for latest osd map after ceph-volume before OSD deploy 68367/head
authorGuillaume Abrioux <gabrioux@ibm.com>
Fri, 10 Apr 2026 14:37:58 +0000 (16:37 +0200)
committerGuillaume Abrioux <gabrioux@ibm.com>
Tue, 14 Apr 2026 07:53:04 +0000 (09:53 +0200)
commit56123af6477a93c62df74e23b6cf3b4fdf6b19e9
tree957cd1b186b98ab0e91ca47e7e189eded5c59b3a
parent3e11365ee1fe68a3012e95fdd57d28b2a9223322
cephadm: wait for latest osd map after ceph-volume before OSD deploy

after ceph-volume creates an OSD, the cached osd map of the mgr can
lag behind the monitors, then get_osd_uuid_map() misses the new osd
id and deploy_osd_daemons_for_existing_osds() skips deploying the
cephadm daemon, which reports a misleading "Created no osd(s)" while
the osd exists.

This behavior is often seen with raw devices. (lvm list returns quicker).

This also fixes get_osd_uuid_map(only_up=True) as the previous branch
never populated the map when 'only_up' was true.
Now we only include osds with 'up==1' so a new OSD created (but still down)
is not treated as already present.

Fixes: https://tracker.ceph.com/issues/75965
Signed-off-by: Guillaume Abrioux <gabrioux@ibm.com>
src/pybind/mgr/cephadm/module.py
src/pybind/mgr/cephadm/services/osd.py
src/pybind/mgr/cephadm/tests/fixtures.py
src/pybind/mgr/cephadm/tests/test_cephadm.py