mgr/Mgr.cc: clear daemon health metrics instead of removing down/out osd from daemon...

author Cory Snyder <csnyder@1111systems.com>

Fri, 19 Apr 2024 15:42:00 +0000 (15:42 +0000)

committer Konstantin Shalygin <k0ste@k0ste.ru>

Wed, 10 Jul 2024 13:55:40 +0000 (20:55 +0700)
author Cory Snyder <csnyder@1111systems.com>
Fri, 19 Apr 2024 15:42:00 +0000 (15:42 +0000)
committer Konstantin Shalygin <k0ste@k0ste.ru>
Wed, 10 Jul 2024 13:55:40 +0000 (20:55 +0700)
diff --git a/src/mgr/Mgr.cc b/src/mgr/Mgr.cc

index cb988cf761cc20e7f5b4f9b00fa546f8f1d25fa1..48dcc13ca3d6c3b0258c14108f57727a20272b5f 100644 (file)
--- a/src/mgr/Mgr.cc
+++ b/src/mgr/Mgr.cc
@@ -537,9 +537,16 @@ void Mgr::handle_osd_map()
        if (daemon_state.is_updating(k)) {
          continue;
        }
+        
+      DaemonStatePtr daemon = daemon_state.get(k);
+        
+      if (daemon && osd_map.is_out(osd_id) && osd_map.is_down(osd_id)) {
+        std::lock_guard l(daemon->lock);
+        daemon->daemon_health_metrics.clear();
+      }
  
        bool update_meta = false;
-      if (daemon_state.exists(k)) {
+      if (daemon) {
          if (osd_map.get_up_from(osd_id) == osd_map.get_epoch()) {
            dout(4) << "Mgr::handle_osd_map: osd." << osd_id
                   << " joined cluster at " << "e" << osd_map.get_epoch()
author	Cory Snyder <csnyder@1111systems.com>
	Fri, 19 Apr 2024 15:42:00 +0000 (15:42 +0000)
committer	Konstantin Shalygin <k0ste@k0ste.ru>
	Wed, 10 Jul 2024 13:55:40 +0000 (20:55 +0700)