osd/PG: fix DeferRecovery vs AllReplicasRecovered race

author Sage Weil <sage@redhat.com>

Fri, 27 Apr 2018 20:00:58 +0000 (15:00 -0500)

committer Sage Weil <sage@redhat.com>

Sun, 29 Apr 2018 21:00:41 +0000 (16:00 -0500)
author Sage Weil <sage@redhat.com>
Fri, 27 Apr 2018 20:00:58 +0000 (15:00 -0500)
committer Sage Weil <sage@redhat.com>
Sun, 29 Apr 2018 21:00:41 +0000 (16:00 -0500)
diff --git a/src/osd/PG.cc b/src/osd/PG.cc

index c4805e03ae8d3648be2151474a2c920f7bbdd1b4..c490c47709d23beee9360da9e7a8c7c29b024ab7 100644 (file)
--- a/src/osd/PG.cc
+++ b/src/osd/PG.cc
@@ -7685,6 +7685,12 @@ boost::statechart::result
  PG::RecoveryState::Recovering::react(const DeferRecovery &evt)
  {
    PG *pg = context< RecoveryMachine >().pg;
+  if (!pg->state_test(PG_STATE_RECOVERING)) {
+    // we may have finished recovery and have an AllReplicasRecovered
+    // event queued to move us to the next state.
+    ldout(pg->cct, 10) << "got defer recovery but not recovering" << dendl;
+    return discard_event();
+  }
    ldout(pg->cct, 10) << "defer recovery, retry delay " << evt.delay << dendl;
    pg->state_set(PG_STATE_RECOVERY_WAIT);
    pg->osd->local_reserver.cancel_reservation(pg->info.pgid);
author	Sage Weil <sage@redhat.com>
	Fri, 27 Apr 2018 20:00:58 +0000 (15:00 -0500)
committer	Sage Weil <sage@redhat.com>
	Sun, 29 Apr 2018 21:00:41 +0000 (16:00 -0500)