]> git.apps.os.sepia.ceph.com Git - ceph.git/commitdiff
os/bluestore: alert on fm/bdev size mismatch
authorIgor Fedotov <ifedotov@suse.com>
Fri, 12 Apr 2019 14:04:07 +0000 (17:04 +0300)
committerIgor Fedotov <ifedotov@suse.com>
Mon, 15 Apr 2019 12:15:00 +0000 (15:15 +0300)
Relates to: https://tracker.ceph.com/issues/39151

Signed-off-by: Igor Fedotov <ifedotov@suse.com>
src/mon/PGMap.cc
src/os/bluestore/BlueStore.cc
src/os/bluestore/BlueStore.h

index 28e1dfc54197bc55baa93819c9eedb1ff54c75d7..aa24d7f9746fc22cf72123770af4c829b24d3ff5 100644 (file)
@@ -3005,6 +3005,8 @@ void PGMap::get_health_checks(
        summary = "BlueStore compression broken";
       } else if (asum.first == "BLUESTORE_LEGACY_STATFS") {
        summary = "Legacy BlueStore stats reporting detected";
+      } else if (asum.first == "BLUESTORE_DISK_SIZE_MISMATCH") {
+       summary = "BlueStore has dangerous mismatch between block device and free list sizes";
       }
       summary += " on ";
       summary += stringify(asum.second.first);
index c0296e7e3c9a0b7e13c269b99835482fd601386e..9eb2cb0fed6535d7d391adc83efc276237556f77 100644 (file)
@@ -4822,6 +4822,19 @@ int BlueStore::_open_fm(KeyValueDB::Transaction t)
     fm = NULL;
     return r;
   }
+  // if space size tracked by free list manager is that higher than actual
+  // dev size one can hit out-of-space allocation which will result
+  // in data loss and/or assertions
+  // Probably user altered the device size somehow.
+  // The only fix for now is to redeploy OSD.
+  if (fm->get_size() >= bdev->get_size() + min_alloc_size) {
+    ostringstream ss;
+    ss << "slow device size mismatch detected, "
+       << " fm size(" << fm->get_size()
+       << ") > slow device size(" << bdev->get_size()
+       << "), Please stop using this OSD as it might cause data loss.";
+    _set_disk_size_mismatch_alert(ss.str());
+  }
   return 0;
 }
 
@@ -13809,6 +13822,11 @@ void BlueStore::_log_alerts(osd_alert_list_t& alerts)
 {
   std::lock_guard l(qlock);
 
+  if (!disk_size_mismatch_alert.empty()) {
+    alerts.emplace(
+      "BLUESTORE_DISK_SIZE_MISMATCH",
+      disk_size_mismatch_alert);
+  }
   if (!legacy_statfs_alert.empty()) {
     alerts.emplace(
       "BLUESTORE_LEGACY_STATFS",
index 4ebe61f6f9c261cff7ebb02373b26f29c2db5a64..5949d3d42a55d81a01d6addca731716568c63864 100644 (file)
@@ -2698,6 +2698,7 @@ private:
   set<string> failed_compressors;
   string spillover_alert;
   string legacy_statfs_alert;
+  string disk_size_mismatch_alert;
 
   void _log_alerts(osd_alert_list_t& alerts);
   bool _set_compression_alert(bool cmode, const char* s) {
@@ -2725,6 +2726,10 @@ private:
   }
 
   void _check_legacy_statfs_alert();
+  void _set_disk_size_mismatch_alert(const string& s) {
+    std::lock_guard l(qlock);
+    disk_size_mismatch_alert = s;
+  }
 
 private: