os/bluestore/bluefs: Make volume selector operations atomic

author Adam Kupczyk <akupczyk@redhat.com>

Wed, 2 Feb 2022 19:28:14 +0000 (20:28 +0100)

committer Igor Fedotov <igor.fedotov@croit.io>

Thu, 21 Sep 2023 18:42:59 +0000 (21:42 +0300)
author Adam Kupczyk <akupczyk@redhat.com>
Wed, 2 Feb 2022 19:28:14 +0000 (20:28 +0100)
committer Igor Fedotov <igor.fedotov@croit.io>
Thu, 21 Sep 2023 18:42:59 +0000 (21:42 +0300)
diff --git a/src/os/bluestore/BlueStore.h b/src/os/bluestore/BlueStore.h

index 023a6b9d52d581655c5a9135959010ef77031a86..e02c385c3d7df3a33f7b627b870706a14c675383 100644 (file)
--- a/src/os/bluestore/BlueStore.h
+++ b/src/os/bluestore/BlueStore.h
@@ -3758,11 +3758,11 @@ class RocksDBBlueFSVolumeSelector : public BlueFSVolumeSelector
    };
    // add +1 row for corresponding per-device totals
    // add +1 column for per-level actual (taken from file size) total
-  typedef matrix_2d<uint64_t, BlueFS::MAX_BDEV + 1, LEVEL_MAX - LEVEL_FIRST + 1> per_level_per_dev_usage_t;
+  typedef matrix_2d<std::atomic<uint64_t>, BlueFS::MAX_BDEV + 1, LEVEL_MAX - LEVEL_FIRST + 1> per_level_per_dev_usage_t;
  
    per_level_per_dev_usage_t per_level_per_dev_usage;
    // file count per level, add +1 to keep total file count
-  uint64_t per_level_files[LEVEL_MAX - LEVEL_FIRST + 1] = { 0 };
+  std::atomic<uint64_t> per_level_files[LEVEL_MAX - LEVEL_FIRST + 1] = { 0 };
  
    // Note: maximum per-device totals below might be smaller than corresponding
    // perf counters by up to a single alloc unit (1M) due to superblock extent.
@@ -3835,27 +3835,27 @@ public:
      for (auto& p : fnode.extents) {
        auto& cur = per_level_per_dev_usage.at(p.bdev, pos);
        auto& max = per_level_per_dev_max.at(p.bdev, pos);
-      cur += p.length;
-      if (cur > max) {
-        max = cur;
+      uint64_t v = cur.fetch_add(p.length) + p.length;
+      while (v > max) {
+       max.exchange(v);
        }
        {
          //update per-device totals
          auto& cur = per_level_per_dev_usage.at(p.bdev, LEVEL_MAX - LEVEL_FIRST);
          auto& max = per_level_per_dev_max.at(p.bdev, LEVEL_MAX - LEVEL_FIRST);
-        cur += p.length;
-        if (cur > max) {
-          max = cur;
-        }
+        uint64_t v = cur.fetch_add(p.length) + p.length;
+       while (v > max) {
+         max.exchange(v);
+       }
        }
      }
      {
        //update per-level actual totals
        auto& cur = per_level_per_dev_usage.at(BlueFS::MAX_BDEV, pos);
        auto& max = per_level_per_dev_max.at(BlueFS::MAX_BDEV, pos);
-      cur += fnode.size;
-      if (cur > max) {
-        max = cur;
+      uint64_t v = cur.fetch_add(fnode.size) + fnode.size;
+      while (v > max) {
+       max.exchange(v);
        }
      }
      ++per_level_files[pos];
@@ -3884,26 +3884,26 @@ public:
      ceph_assert(per_level_files[LEVEL_MAX - LEVEL_FIRST] > 0);
      --per_level_files[LEVEL_MAX - LEVEL_FIRST];
    }
-  void add_usage(void* hint, uint64_t fsize) override {
+  void add_usage(void* hint, uint64_t size_more) override {
      if (hint == nullptr)
        return;
      size_t pos = (size_t)hint - LEVEL_FIRST;
      //update per-level actual totals
      auto& cur = per_level_per_dev_usage.at(BlueFS::MAX_BDEV, pos);
      auto& max = per_level_per_dev_max.at(BlueFS::MAX_BDEV, pos);
-    cur += fsize;
-    if (cur > max) {
-      max = cur;
+    uint64_t v = cur.fetch_add(size_more) + size_more;
+    while (v > max) {
+      max.exchange(v);
      }
    }
-  void sub_usage(void* hint, uint64_t fsize) override {
+  void sub_usage(void* hint, uint64_t size_less) override {
      if (hint == nullptr)
        return;
      size_t pos = (size_t)hint - LEVEL_FIRST;
      //update per-level actual totals
      auto& cur = per_level_per_dev_usage.at(BlueFS::MAX_BDEV, pos);
-    ceph_assert(cur >= fsize);
-    per_level_per_dev_usage.at(BlueFS::MAX_BDEV, pos) -= fsize;
+    ceph_assert(cur >= size_less);
+    cur -= size_less;
    }
  
    uint8_t select_prefer_bdev(void* h) override;
author	Adam Kupczyk <akupczyk@redhat.com>
	Wed, 2 Feb 2022 19:28:14 +0000 (20:28 +0100)
committer	Igor Fedotov <igor.fedotov@croit.io>
	Thu, 21 Sep 2023 18:42:59 +0000 (21:42 +0300)