mon: cap keys in mon_sync messages

author Sage Weil <sage@redhat.com>

Mon, 2 Dec 2019 13:43:54 +0000 (07:43 -0600)

committer Dan van der Ster <daniel.vanderster@cern.ch>

Thu, 5 Mar 2020 20:10:52 +0000 (21:10 +0100)
author Sage Weil <sage@redhat.com>
Mon, 2 Dec 2019 13:43:54 +0000 (07:43 -0600)
committer Dan van der Ster <daniel.vanderster@cern.ch>
Thu, 5 Mar 2020 20:10:52 +0000 (21:10 +0100)
diff --git a/src/common/legacy_config_opts.h b/src/common/legacy_config_opts.h

index 7aae31e8eabfe73031dd51545c384610a3f3b681..d762a99e041d37c4fd80b390a18927643e08236b 100644 (file)
--- a/src/common/legacy_config_opts.h
+++ b/src/common/legacy_config_opts.h
@@ -284,6 +284,7 @@ OPTION(mon_scrub_inject_missing_keys, OPT_DOUBLE) // probability of injected mis
  OPTION(mon_config_key_max_entry_size, OPT_INT) // max num bytes per config-key entry
  OPTION(mon_sync_timeout, OPT_DOUBLE)
  OPTION(mon_sync_max_payload_size, OPT_U32) // max size for a sync chunk payload (say)
+OPTION(mon_sync_max_payload_keys, OPT_INT)
  OPTION(mon_sync_debug, OPT_BOOL) // enable sync-specific debug
  OPTION(mon_inject_sync_get_chunk_delay, OPT_DOUBLE)  // inject N second delay on each get_chunk request
  OPTION(mon_osd_force_trim_to, OPT_INT)   // force mon to trim maps to this point, regardless of min_last_epoch_clean (dangerous)
diff --git a/src/common/options.cc b/src/common/options.cc

index 8135ea8f1ebcdd79042c1dac04492fa87c4e0ce0..95ddada8ef942d60fd298bd66e9213de8d6be4d0 100644 (file)
--- a/src/common/options.cc
+++ b/src/common/options.cc
@@ -1941,6 +1941,11 @@ std::vector<Option> get_global_options() {
      .add_service("mon")
      .set_description("target max message payload for mon sync"),
  
+    Option("mon_sync_max_payload_keys", Option::TYPE_INT, Option::LEVEL_ADVANCED)
+    .set_default(2000)
+    .add_service("mon")
+    .set_description("target max keys in message payload for mon sync"),
+
      Option("mon_sync_debug", Option::TYPE_BOOL, Option::LEVEL_DEV)
      .set_default(false)
      .add_service("mon")
diff --git a/src/mon/Monitor.cc b/src/mon/Monitor.cc

index cd634d349b1ae715da7df809823cc99c50ec0603..f891a923ca4f16ca0334d129777f0eba2d9dc6a4 100644 (file)
--- a/src/mon/Monitor.cc
+++ b/src/mon/Monitor.cc
@@ -1628,8 +1628,11 @@ void Monitor::handle_sync_get_chunk(MonOpRequestRef op)
    MMonSync *reply = new MMonSync(MMonSync::OP_CHUNK, sp.cookie);
    auto tx(std::make_shared<MonitorDBStore::Transaction>());
  
-  int left = g_conf()->mon_sync_max_payload_size;
-  while (sp.last_committed < paxos->get_version() && left > 0) {
+  int bytes_left = g_conf()->mon_sync_max_payload_size;
+  int keys_left = g_conf()->mon_sync_max_payload_keys;
+  while (sp.last_committed < paxos->get_version() &&
+        bytes_left > 0 &&
+        keys_left > 0) {
      bufferlist bl;
      sp.last_committed++;
  
@@ -1637,14 +1640,15 @@ void Monitor::handle_sync_get_chunk(MonOpRequestRef op)
      ceph_assert(err == 0);
  
      tx->put(paxos->get_name(), sp.last_committed, bl);
-    left -= bl.length();
+    bytes_left -= bl.length();
+    --keys_left;
      dout(20) << __func__ << " including paxos state " << sp.last_committed
              << dendl;
    }
    reply->last_committed = sp.last_committed;
  
-  if (sp.full && left > 0) {
-    sp.synchronizer->get_chunk_tx(tx, left);
+  if (sp.full && bytes_left > 0 && keys_left > 0) {
+    sp.synchronizer->get_chunk_tx(tx, bytes_left, keys_left);
      sp.last_key = sp.synchronizer->get_last_key();
      reply->last_key = sp.last_key;
    }
diff --git a/src/mon/MonitorDBStore.h b/src/mon/MonitorDBStore.h

index 45dc84004e76df4edc7b62ed485eff3778287b48..6dba96064be091d1cd2a9e0ed3ef92a61aad8dcc 100644 (file)
--- a/src/mon/MonitorDBStore.h
+++ b/src/mon/MonitorDBStore.h
@@ -429,7 +429,8 @@ class MonitorDBStore
      virtual bool has_next_chunk() {
        return !done && _is_valid();
      }
-    virtual void get_chunk_tx(TransactionRef tx, uint64_t max) = 0;
+    virtual void get_chunk_tx(TransactionRef tx, uint64_t max_bytes,
+                             uint64_t max_keys) = 0;
      virtual pair<string,string> get_next_key() = 0;
    };
    typedef std::shared_ptr<StoreIteratorImpl> Synchronizer;
@@ -457,7 +458,8 @@ class MonitorDBStore
       *                     differ from the one passed on to the function)
       * @param last_key[out] Last key in the chunk
       */
-    void get_chunk_tx(TransactionRef tx, uint64_t max_bytes) override {
+    void get_chunk_tx(TransactionRef tx, uint64_t max_bytes,
+                     uint64_t max_keys) override {
        ceph_assert(done == false);
        ceph_assert(iter->valid() == true);
  
@@ -468,7 +470,8 @@ class MonitorDBStore
           bufferlist value = iter->value();
           if (tx->empty() ||
               (tx->get_bytes() + value.length() + key.size() +
-              prefix.size() < max_bytes)) {
+              prefix.size() < max_bytes &&
+              tx->get_keys() < max_keys)) {
             // NOTE: putting every key in a separate transaction is
             // questionable as far as efficiency goes
             auto tmp(std::make_shared<Transaction>());
author	Sage Weil <sage@redhat.com>
	Mon, 2 Dec 2019 13:43:54 +0000 (07:43 -0600)
committer	Dan van der Ster <daniel.vanderster@cern.ch>
	Thu, 5 Mar 2020 20:10:52 +0000 (21:10 +0100)
src/common/legacy_config_opts.h		patch \| blob \| history
src/common/options.cc		patch \| blob \| history
src/mon/Monitor.cc		patch \| blob \| history
src/mon/MonitorDBStore.h		patch \| blob \| history