mon/OSDMonitor: make down osd count sensible

author Sage Weil <sage@inktank.com>

Mon, 16 Jun 2014 23:27:05 +0000 (16:27 -0700)

committer Sage Weil <sage@inktank.com>

Tue, 1 Jul 2014 23:12:01 +0000 (16:12 -0700)
author Sage Weil <sage@inktank.com>
Mon, 16 Jun 2014 23:27:05 +0000 (16:27 -0700)
committer Sage Weil <sage@inktank.com>
Tue, 1 Jul 2014 23:12:01 +0000 (16:12 -0700)
diff --git a/src/mon/OSDMonitor.cc b/src/mon/OSDMonitor.cc

index c949a8b4f22a7e378eeecb6c970348095e3e84f5..5f7752827c1a550feec2e1c6677b24581cb3024e 100644 (file)
--- a/src/mon/OSDMonitor.cc
+++ b/src/mon/OSDMonitor.cc
@@ -2007,29 +2007,33 @@ void OSDMonitor::get_health(list<pair<health_status_t,string> >& summary,
                             list<pair<health_status_t,string> > *detail) const
  {
    int num_osds = osdmap.get_num_osds();
-  int num_up_osds = osdmap.get_num_up_osds();
-  int num_in_osds = osdmap.get_num_in_osds();
  
    if (num_osds == 0) {
      summary.push_back(make_pair(HEALTH_ERR, "no osds"));
    } else {
-    if (num_up_osds < num_in_osds) {
-      ostringstream ss;
-      ss << (num_in_osds - num_up_osds) << "/" << num_in_osds << " in osds are down";
-      summary.push_back(make_pair(HEALTH_WARN, ss.str()));
-
-      if (detail) {
-       for (int i = 0; i < osdmap.get_max_osd(); i++) {
-         if (osdmap.exists(i) && !osdmap.is_up(i)) {
-           const osd_info_t& info = osdmap.get_info(i);
-           ostringstream ss;
-           ss << "osd." << i << " is down since epoch " << info.down_at
-              << ", last address " << osdmap.get_addr(i);
-           detail->push_back(make_pair(HEALTH_WARN, ss.str()));
-         }
+    int num_in_osds = 0;
+    int num_down_in_osds = 0;
+    for (int i = 0; i < osdmap.get_max_osd(); i++) {
+      if (!osdmap.exists(i) || osdmap.is_out(i))
+       continue;
+      ++num_in_osds;
+      if (!osdmap.is_up(i)) {
+       ++num_down_in_osds;
+       if (detail) {
+         const osd_info_t& info = osdmap.get_info(i);
+         ostringstream ss;
+         ss << "osd." << i << " is down since epoch " << info.down_at
+            << ", last address " << osdmap.get_addr(i);
+         detail->push_back(make_pair(HEALTH_WARN, ss.str()));
         }
        }
      }
+    assert(num_down_in_osds <= num_in_osds);
+    if (num_down_in_osds > 0) {
+      ostringstream ss;
+      ss << num_down_in_osds << "/" << num_in_osds << " in osds are down";
+      summary.push_back(make_pair(HEALTH_WARN, ss.str()));
+    }
  
      // warn about flags
      if (osdmap.test_flag(CEPH_OSDMAP_PAUSERD |
author	Sage Weil <sage@inktank.com>
	Mon, 16 Jun 2014 23:27:05 +0000 (16:27 -0700)
committer	Sage Weil <sage@inktank.com>
	Tue, 1 Jul 2014 23:12:01 +0000 (16:12 -0700)