osd/scheduler: add mclock queue length perfcounter

author zhangjianwei2 <zhangjianwei2_yewu@cmss.chinamobile.com>

Thu, 27 Jun 2024 08:20:00 +0000 (16:20 +0800)

committer Sridhar Seshasayee <sseshasa@redhat.com>

Tue, 6 Aug 2024 04:07:22 +0000 (09:37 +0530)
author zhangjianwei2 <zhangjianwei2_yewu@cmss.chinamobile.com>
Thu, 27 Jun 2024 08:20:00 +0000 (16:20 +0800)
committer Sridhar Seshasayee <sseshasa@redhat.com>
Tue, 6 Aug 2024 04:07:22 +0000 (09:37 +0530)
diff --git a/src/osd/scheduler/mClockScheduler.cc b/src/osd/scheduler/mClockScheduler.cc

index f72683d527923b9e73c6d513606b121ad34476aa..7efa46dacf226f8d2addaa89879ea325acf050b2 100644 (file)
--- a/src/osd/scheduler/mClockScheduler.cc
+++ b/src/osd/scheduler/mClockScheduler.cc
@@ -30,13 +30,98 @@ using namespace std::placeholders;
  
  namespace ceph::osd::scheduler {
  
+void mClockScheduler::_get_mclock_counter(scheduler_id_t id)
+{
+  if (!logger) {
+    return;
+  }
+
+  /* op enter mclock queue will +1 */
+  logger->inc(l_mclock_all_type_queue_len);
+
+  switch (id.class_id) {
+  case op_scheduler_class::immediate:
+    logger->inc(l_mclock_immediate_queue_len);
+    break;
+  case op_scheduler_class::client:
+    logger->inc(l_mclock_client_queue_len);
+    break;
+  case op_scheduler_class::background_recovery:
+    logger->inc(l_mclock_recovery_queue_len);
+    break;
+  case op_scheduler_class::background_best_effort:
+    logger->inc(l_mclock_best_effort_queue_len);
+    break;
+   default:
+    derr << __func__ << " unknown class_id=" << id.class_id
+         << " unknown id=" << id << dendl;
+    break;
+  }
+}
+
+void mClockScheduler::_put_mclock_counter(scheduler_id_t id)
+{
+  if (!logger) {
+    return;
+  }
+
+  /* op leave mclock queue will -1 */
+  logger->dec(l_mclock_all_type_queue_len);
+
+  switch (id.class_id) {
+  case op_scheduler_class::immediate:
+    logger->dec(l_mclock_immediate_queue_len);
+    break;
+  case op_scheduler_class::client:
+    logger->dec(l_mclock_client_queue_len);
+    break;
+  case op_scheduler_class::background_recovery:
+    logger->dec(l_mclock_recovery_queue_len);
+    break;
+  case op_scheduler_class::background_best_effort:
+    logger->dec(l_mclock_best_effort_queue_len);
+    break;
+   default:
+    derr << __func__ << " unknown class_id=" << id.class_id
+         << " unknown id=" << id << dendl;
+    break;
+  }
+}
+
+void mClockScheduler::_init_logger()
+{
+  PerfCountersBuilder m(cct, "mclock-shard-queue-" + std::to_string(shard_id),
+                        l_mclock_first, l_mclock_last);
+
+  m.add_u64_counter(l_mclock_immediate_queue_len, "mclock_immediate_queue_len",
+                    "high_priority op count in mclock queue");
+  m.add_u64_counter(l_mclock_client_queue_len, "mclock_client_queue_len",
+                    "client type op count in mclock queue");
+  m.add_u64_counter(l_mclock_recovery_queue_len, "mclock_recovery_queue_len",
+                    "background_recovery type op count in mclock queue");
+  m.add_u64_counter(l_mclock_best_effort_queue_len, "mclock_best_effort_queue_len",
+                    "background_best_effort type op count in mclock queue");
+  m.add_u64_counter(l_mclock_all_type_queue_len, "mclock_all_type_queue_len",
+                    "all type op count in mclock queue");
+
+  logger = m.create_perf_counters();
+  cct->get_perfcounters_collection()->add(logger);
+
+  logger->set(l_mclock_immediate_queue_len, 0);
+  logger->set(l_mclock_client_queue_len, 0);
+  logger->set(l_mclock_recovery_queue_len, 0);
+  logger->set(l_mclock_best_effort_queue_len, 0);
+  logger->set(l_mclock_all_type_queue_len, 0);
+}
+
  mClockScheduler::mClockScheduler(CephContext *cct,
    int whoami,
    uint32_t num_shards,
    int shard_id,
    bool is_rotational,
    unsigned cutoff_priority,
-  MonClient *monc)
+  MonClient *monc,
+  bool init_perfcounter)
    : cct(cct),
      whoami(whoami),
      num_shards(num_shards),
@@ -57,6 +142,9 @@ mClockScheduler::mClockScheduler(CephContext *cct,
    set_config_defaults_from_profile();
    client_registry.update_from_config(
      cct->_conf, osd_bandwidth_capacity_per_shard);
+  if (init_perfcounter) {
+    _init_logger();
+  }
  }
  
  /* ClientRegistry holds the dmclock::ClientInfo configuration parameters
@@ -406,6 +494,7 @@ void mClockScheduler::enqueue(OpSchedulerItem&& item)
        std::move(item),
        id,
        cost);
+    _get_mclock_counter(id);
    }
  
   dout(20) << __func__ << " client_count: " << scheduler.client_count()
@@ -446,6 +535,12 @@ void mClockScheduler::enqueue_high(unsigned priority,
    } else {
      high_priority[priority].push_front(std::move(item));
    }
+
+  scheduler_id_t id = scheduler_id_t {
+    op_scheduler_class::immediate,
+    client_profile_id_t()
+  };
+  _get_mclock_counter(id);
  }
  
  WorkItem mClockScheduler::dequeue()
@@ -461,6 +556,12 @@ WorkItem mClockScheduler::dequeue()
        high_priority.erase(iter);
      }
      ceph_assert(std::get_if<OpSchedulerItem>(&ret));
+
+    scheduler_id_t id = scheduler_id_t {
+      op_scheduler_class::immediate,
+      client_profile_id_t()
+    };
+    _put_mclock_counter(id);
      return ret;
    } else {
      mclock_queue_t::PullReq result = scheduler.pull_request();
@@ -474,6 +575,7 @@ WorkItem mClockScheduler::dequeue()
        ceph_assert(result.is_retn());
  
        auto &retn = result.get_retn();
+      _put_mclock_counter(retn.client);
        return std::move(*retn.request);
      }
    }
@@ -594,6 +696,10 @@ void mClockScheduler::handle_conf_change(
  mClockScheduler::~mClockScheduler()
  {
    cct->_conf.remove_observer(this);
+  if (logger) {
+    delete logger;
+    logger = nullptr;
+  }
  }
  
  }
diff --git a/src/osd/scheduler/mClockScheduler.h b/src/osd/scheduler/mClockScheduler.h

index 7d3eb64afa40f110fc056bc1fd67c84e43b65f55..839ae35bdfb88fc77409095fe52000eebc027e20 100644 (file)
--- a/src/osd/scheduler/mClockScheduler.h
+++ b/src/osd/scheduler/mClockScheduler.h
@@ -30,6 +30,16 @@
  #include "osd/scheduler/OpSchedulerItem.h"
  
  
+enum {
+  l_mclock_first = 15000,
+  l_mclock_immediate_queue_len,
+  l_mclock_client_queue_len,
+  l_mclock_recovery_queue_len,
+  l_mclock_best_effort_queue_len,
+  l_mclock_all_type_queue_len,
+  l_mclock_last,
+};
+
  namespace ceph::osd::scheduler {
  
  constexpr double default_min = 0.0;
@@ -98,6 +108,7 @@ class mClockScheduler : public OpScheduler, md_config_obs_t {
    const bool is_rotational;
    const unsigned cutoff_priority;
    MonClient *monc;
+  PerfCounters *logger = nullptr;
  
    /**
     * osd_bandwidth_cost_per_io
@@ -219,7 +230,7 @@ class mClockScheduler : public OpScheduler, md_config_obs_t {
  public: 
    mClockScheduler(CephContext *cct, int whoami, uint32_t num_shards,
      int shard_id, bool is_rotational, unsigned cutoff_priority,
-    MonClient *monc);
+    MonClient *monc, bool init_perfcounter=true);
    ~mClockScheduler() override;
  
    /// Calculate scaled cost per item
@@ -268,6 +279,9 @@ public:
  private:
    // Enqueue the op to the high priority queue
    void enqueue_high(unsigned prio, OpSchedulerItem &&item, bool front = false);
+  void _init_logger();
+  void _get_mclock_counter(scheduler_id_t id);
+  void _put_mclock_counter(scheduler_id_t id);
  };
  
  }
diff --git a/src/test/osd/TestMClockScheduler.cc b/src/test/osd/TestMClockScheduler.cc

index 325ebe77e802f60e7bdbbb5ab04dbd1fe624953e..1499493159bb1c4fefb8016636fd312330245ade 100644 (file)
--- a/src/test/osd/TestMClockScheduler.cc
+++ b/src/test/osd/TestMClockScheduler.cc
@@ -33,6 +33,14 @@ public:
    bool is_rotational;
    unsigned cutoff_priority;
    MonClient *monc;
+  /*
+   * FIXME:
+   * init_perfcounter = false
+   * src/common: dead loop in PerfCountersCollectionImpl::add()
+   * when adding the same logger_ptr to logger_collection.
+   * see https://tracker.ceph.com/issues/66758.
+   */
+  bool init_perfcounter;
    mClockScheduler q;
  
    uint64_t client1;
@@ -46,8 +54,9 @@ public:
      is_rotational(false),
      cutoff_priority(12),
      monc(nullptr),
+    init_perfcounter(false),
      q(g_ceph_context, whoami, num_shards, shard_id, is_rotational,
-      cutoff_priority, monc),
+      cutoff_priority, monc, init_perfcounter),
      client1(1001),
      client2(9999),
      client3(100000001)
author	zhangjianwei2 <zhangjianwei2_yewu@cmss.chinamobile.com>
	Thu, 27 Jun 2024 08:20:00 +0000 (16:20 +0800)
committer	Sridhar Seshasayee <sseshasa@redhat.com>
	Tue, 6 Aug 2024 04:07:22 +0000 (09:37 +0530)
src/osd/scheduler/mClockScheduler.cc		patch \| blob \| history
src/osd/scheduler/mClockScheduler.h		patch \| blob \| history
src/test/osd/TestMClockScheduler.cc		patch \| blob \| history