]> git-server-git.apps.pok.os.sepia.ceph.com Git - ceph.git/commit
cephadm: wait for latest osd map after ceph-volume before OSD deploy 68379/head
authorGuillaume Abrioux <gabrioux@ibm.com>
Fri, 10 Apr 2026 14:37:58 +0000 (16:37 +0200)
committerGuillaume Abrioux <gabrioux@ibm.com>
Wed, 15 Apr 2026 07:14:49 +0000 (07:14 +0000)
commit47baf8b15c5583319467f40b7d94a9127c03d968
treeb5e2f64e929e7e6ffae3d4fb13695a77bb5dedde
parent6c68f83fe5db754e4ba0c40dfc16965c460e28b7
cephadm: wait for latest osd map after ceph-volume before OSD deploy

after ceph-volume creates an OSD, the cached osd map of the mgr can
lag behind the monitors, then get_osd_uuid_map() misses the new osd
id and deploy_osd_daemons_for_existing_osds() skips deploying the
cephadm daemon, which reports a misleading "Created no osd(s)" while
the osd exists.

This behavior is often seen with raw devices. (lvm list returns quicker).

This also fixes get_osd_uuid_map(only_up=True) as the previous branch
never populated the map when 'only_up' was true.
Now we only include osds with 'up==1' so a new OSD created (but still down)
is not treated as already present.

Fixes: https://tracker.ceph.com/issues/75965
Signed-off-by: Guillaume Abrioux <gabrioux@ibm.com>
(cherry picked from commit 56123af6477a93c62df74e23b6cf3b4fdf6b19e9)
src/pybind/mgr/cephadm/module.py
src/pybind/mgr/cephadm/services/osd.py
src/pybind/mgr/cephadm/tests/fixtures.py
src/pybind/mgr/cephadm/tests/test_cephadm.py