]> git-server-git.apps.pok.os.sepia.ceph.com Git - ceph.git/commit
mgr/DaemonServer: auto-tune stats period when message queue gets backed up 65611/head
authorNitzan Mordechai <nmordech@redhat.com>
Thu, 18 Sep 2025 05:16:51 +0000 (05:16 +0000)
committerNitzan Mordechai <nmordech@ibm.com>
Tue, 19 May 2026 14:16:29 +0000 (14:16 +0000)
commit027a609a8274b932e55e3aa529f33217de31a15b
tree2a9afbb512be24c2316c668ab7141e5094dfc885
parenta936efb938e5d0d69cfc7eb354aca5f48b99c095
mgr/DaemonServer: auto-tune stats period when message queue gets backed up

The mgr can get overwhelmed when there's a lot of cluster activity and
daemons are sending stats reports faster than we can process them.
This commit adds logic to monitor the messenger queue depth and bump
up mgr_stats_period when things get congested. This reduces the
frequency of daemon stat reports, allowing the mgr to process existing
reports without being overwhelmed by new ones. The period automatically
scales back down when the queue clears up.

Added mgr_stats_period_autotune (on by default) and a queue threshold
setting. Recovery happens automatically when the queue clears up.
Max period is capped at 60 seconds to prevent excessive stat delays.

Fixes: https://tracker.ceph.com/issues/73151
Signed-off-by: Nitzan Mordechai <nmordech@ibm.com>
PendingReleaseNotes
doc/mgr/administrator.rst
src/common/options/mgr.yaml.in
src/mgr/DaemonServer.cc
src/mgr/DaemonServer.h