osd: fix heartbeat brain-split behaviour

author xie xingguo <xie.xingguo@zte.com.cn>

Fri, 16 Nov 2018 06:56:59 +0000 (14:56 +0800)

committer xie xingguo <xie.xingguo@zte.com.cn>

Wed, 28 Nov 2018 09:03:58 +0000 (17:03 +0800)
author xie xingguo <xie.xingguo@zte.com.cn>
Fri, 16 Nov 2018 06:56:59 +0000 (14:56 +0800)
committer xie xingguo <xie.xingguo@zte.com.cn>
Wed, 28 Nov 2018 09:03:58 +0000 (17:03 +0800)
diff --git a/src/osd/OSD.cc b/src/osd/OSD.cc

index e239e4961896d580a1b2c01d697a886773e83e33..a68dcded2adab3311d72a4a30302f398d38a4edd 100644 (file)
--- a/src/osd/OSD.cc
+++ b/src/osd/OSD.cc
@@ -5619,8 +5619,17 @@ bool OSD::_is_healthy()
    }
  
    if (is_waiting_for_healthy()) {
+     utime_t now = ceph_clock_now();
+     utime_t grace = utime_t(cct->_conf->osd_max_markdown_period, 0);
+     while (!osd_markdown_log.empty() &&
+             osd_markdown_log.front() + grace < now)
+       osd_markdown_log.pop_front();
+     if (osd_markdown_log.size() <= 1) {
+       dout(5) << __func__ << " first time marked as down,"
+               << " try reboot unconditionally" << dendl;
+       return true;
+    }
      std::lock_guard l(heartbeat_lock);
-    utime_t now = ceph_clock_now();
      int num = 0, up = 0;
      for (map<int,HeartbeatInfo>::iterator p = heartbeat_peers.begin();
          p != heartbeat_peers.end();
author	xie xingguo <xie.xingguo@zte.com.cn>
	Fri, 16 Nov 2018 06:56:59 +0000 (14:56 +0800)
committer	xie xingguo <xie.xingguo@zte.com.cn>
	Wed, 28 Nov 2018 09:03:58 +0000 (17:03 +0800)