qa: simplify and use correct recovery procedure

author Patrick Donnelly <pdonnell@redhat.com>

Tue, 20 Sep 2022 14:57:01 +0000 (10:57 -0400)

committer Patrick Donnelly <pdonnell@redhat.com>

Tue, 4 Apr 2023 12:50:44 +0000 (08:50 -0400)
author Patrick Donnelly <pdonnell@redhat.com>
Tue, 20 Sep 2022 14:57:01 +0000 (10:57 -0400)
committer Patrick Donnelly <pdonnell@redhat.com>
Tue, 4 Apr 2023 12:50:44 +0000 (08:50 -0400)
diff --git a/qa/tasks/cephfs/cephfs_test_case.py b/qa/tasks/cephfs/cephfs_test_case.py

index 41831dac6f5e198e213232f845aae695f4d59076..ded3fa379de2b567e5c86434d860f58c42ba3db9 100644 (file)
--- a/qa/tasks/cephfs/cephfs_test_case.py
+++ b/qa/tasks/cephfs/cephfs_test_case.py
@@ -72,9 +72,6 @@ class CephFSTestCase(CephTestCase):
      # Whether to create the default filesystem during setUp
      REQUIRE_FILESYSTEM = True
  
-    # requires REQUIRE_FILESYSTEM = True
-    REQUIRE_RECOVERY_FILESYSTEM = False
-
      # create a backup filesystem if required.
      # required REQUIRE_FILESYSTEM enabled
      REQUIRE_BACKUP_FILESYSTEM = False
@@ -192,20 +189,6 @@ class CephFSTestCase(CephTestCase):
              self.backup_fs = self.mds_cluster.newfs(name="backup_fs")
              self.backup_fs.wait_for_daemons()
  
-        if self.REQUIRE_RECOVERY_FILESYSTEM:
-            if not self.REQUIRE_FILESYSTEM:
-                self.skipTest("Recovery filesystem requires a primary filesystem as well")
-            # After Octopus is EOL, we can remove this setting:
-            self.fs.mon_manager.raw_cluster_cmd('fs', 'flag', 'set',
-                                                'enable_multiple', 'true',
-                                                '--yes-i-really-mean-it')
-            self.recovery_fs = self.mds_cluster.newfs(name="recovery_fs", create=False)
-            self.recovery_fs.set_metadata_overlay(True)
-            self.recovery_fs.set_data_pool_name(self.fs.get_data_pool_name())
-            self.recovery_fs.create()
-            self.recovery_fs.getinfo(refresh=True)
-            self.recovery_fs.wait_for_daemons()
-
          # Load an config settings of interest
          for setting in self.LOAD_SETTINGS:
              setattr(self, setting, float(self.fs.mds_asok(
diff --git a/qa/tasks/cephfs/filesystem.py b/qa/tasks/cephfs/filesystem.py

index 35b80106dc8c5ab1976078cdfc82f0a3e7285f80..795e18af9f8a3a30f91bf9ef41a4993cfb43a677 100644 (file)
--- a/qa/tasks/cephfs/filesystem.py
+++ b/qa/tasks/cephfs/filesystem.py
@@ -485,7 +485,6 @@ class Filesystem(MDSCluster):
          self.name = name
          self.id = None
          self.metadata_pool_name = None
-        self.metadata_overlay = False
          self.data_pool_name = None
          self.data_pools = None
          self.fs_config = fs_config
@@ -539,11 +538,6 @@ class Filesystem(MDSCluster):
          self.get_pool_names(status = status, refresh = refresh)
          return status
  
-    def set_metadata_overlay(self, overlay):
-        if self.id is not None:
-            raise RuntimeError("cannot specify fscid when configuring overlay")
-        self.metadata_overlay = overlay
-
      def deactivate(self, rank):
          if rank < 0:
              raise RuntimeError("invalid rank")
@@ -644,7 +638,7 @@ class Filesystem(MDSCluster):
      target_size_ratio = 0.9
      target_size_ratio_ec = 0.9
  
-    def create(self):
+    def create(self, recover=False, metadata_overlay=False):
          if self.name is None:
              self.name = "cephfs"
          if self.metadata_pool_name is None:
@@ -656,7 +650,7 @@ class Filesystem(MDSCluster):
  
          # will use the ec pool to store the data and a small amount of
          # metadata still goes to the primary data pool for all files.
-        if not self.metadata_overlay and self.ec_profile and 'disabled' not in self.ec_profile:
+        if not metadata_overlay and self.ec_profile and 'disabled' not in self.ec_profile:
              self.target_size_ratio = 0.05
  
          log.debug("Creating filesystem '{0}'".format(self.name))
@@ -683,16 +677,14 @@ class Filesystem(MDSCluster):
              else:
                  raise
  
-        if self.metadata_overlay:
-            self.mon_manager.raw_cluster_cmd('fs', 'new',
-                                             self.name, self.metadata_pool_name, data_pool_name,
-                                             '--allow-dangerous-metadata-overlay')
-        else:
-            self.mon_manager.raw_cluster_cmd('fs', 'new',
-                                             self.name,
-                                             self.metadata_pool_name,
-                                             data_pool_name)
+        args = ["fs", "new", self.name, self.metadata_pool_name, data_pool_name]
+        if recover:
+            args.append('--recover')
+        if metadata_overlay:
+            args.append('--allow-dangerous-metadata-overlay')
+        self.mon_manager.raw_cluster_cmd(*args)
  
+        if not recover:
              if self.ec_profile and 'disabled' not in self.ec_profile:
                  ec_data_pool_name = data_pool_name + "_ec"
                  log.debug("EC profile is %s", self.ec_profile)
@@ -1070,6 +1062,9 @@ class Filesystem(MDSCluster):
      def rank_freeze(self, yes, rank=0):
          self.mon_manager.raw_cluster_cmd("mds", "freeze", "{}:{}".format(self.id, rank), str(yes).lower())
  
+    def rank_repaired(self, rank):
+        self.mon_manager.raw_cluster_cmd("mds", "repaired", "{}:{}".format(self.id, rank))
+
      def rank_fail(self, rank=0):
          self.mon_manager.raw_cluster_cmd("mds", "fail", "{}:{}".format(self.id, rank))
  
diff --git a/qa/tasks/cephfs/test_recovery_pool.py b/qa/tasks/cephfs/test_recovery_pool.py

index 9926b3670cac3b4bd30b2fd6b28d99c4384587c3..be7b63c35c9fb2fb554a1dd700f9ab632dba915b 100644 (file)
--- a/qa/tasks/cephfs/test_recovery_pool.py
+++ b/qa/tasks/cephfs/test_recovery_pool.py
@@ -16,11 +16,7 @@ ValidationError = namedtuple("ValidationError", ["exception", "backtrace"])
  
  
  class OverlayWorkload(object):
-    def __init__(self, orig_fs, recovery_fs, orig_mount, recovery_mount):
-        self._orig_fs = orig_fs
-        self._recovery_fs = recovery_fs
-        self._orig_mount = orig_mount
-        self._recovery_mount = recovery_mount
+    def __init__(self):
          self._initial_state = None
  
          # Accumulate backtraces for every failed validation, and return them.  Backtraces
@@ -51,41 +47,40 @@ class OverlayWorkload(object):
          """
          raise NotImplementedError()
  
-    def damage(self):
+    def damage(self, fs):
          """
          Damage the filesystem pools in ways that will be interesting to recover from.  By
          default just wipe everything in the metadata pool
          """
  
-        pool = self._orig_fs.get_metadata_pool_name()
-        self._orig_fs.rados(["purge", pool, '--yes-i-really-really-mean-it'])
+        pool = fs.get_metadata_pool_name()
+        fs.rados(["purge", pool, '--yes-i-really-really-mean-it'])
  
-    def flush(self):
+    def flush(self, fs):
          """
          Called after client unmount, after write: flush whatever you want
          """
-        self._orig_fs.mds_asok(["flush", "journal"])
-        self._recovery_fs.mds_asok(["flush", "journal"])
+        fs.rank_asok(["flush", "journal"])
  
  
  class SimpleOverlayWorkload(OverlayWorkload):
      """
      Single file, single directory, check that it gets recovered and so does its size
      """
-    def write(self):
-        self._orig_mount.run_shell(["mkdir", "subdir"])
-        self._orig_mount.write_n_mb("subdir/sixmegs", 6)
-        self._initial_state = self._orig_mount.stat("subdir/sixmegs")
-
-    def validate(self):
-        self._recovery_mount.run_shell(["ls", "subdir"])
-        st = self._recovery_mount.stat("subdir/sixmegs")
+    def write(self, mount):
+        mount.run_shell(["mkdir", "subdir"])
+        mount.write_n_mb("subdir/sixmegs", 6)
+        self._initial_state = mount.stat("subdir/sixmegs")
+
+    def validate(self, recovery_mount):
+        recovery_mount.run_shell(["ls", "subdir"])
+        st = recovery_mount.stat("subdir/sixmegs")
          self.assert_equal(st['st_size'], self._initial_state['st_size'])
          return self._errors
  
  class TestRecoveryPool(CephFSTestCase):
      MDSS_REQUIRED = 2
-    CLIENTS_REQUIRED = 2
+    CLIENTS_REQUIRED = 1
      REQUIRE_RECOVERY_FILESYSTEM = True
  
      def is_marked_damaged(self, rank):
@@ -100,95 +95,77 @@ class TestRecoveryPool(CephFSTestCase):
  
          # First, inject some files
  
-        workload.write()
+        workload.write(self.mount_a)
  
          # Unmount the client and flush the journal: the tool should also cope with
          # situations where there is dirty metadata, but we'll test that separately
          self.mount_a.umount_wait()
-        self.mount_b.umount_wait()
-        workload.flush()
-
-        # Create the alternate pool if requested
-        recovery_fs = self.recovery_fs.name
-        recovery_pool = self.recovery_fs.get_metadata_pool_name()
-        self.recovery_fs.data_scan(['init', '--force-init',
-                                    '--filesystem', recovery_fs,
-                                    '--alternate-pool', recovery_pool])
-        self.recovery_fs.mon_manager.raw_cluster_cmd('-s')
-        self.recovery_fs.table_tool([recovery_fs + ":0", "reset", "session"])
-        self.recovery_fs.table_tool([recovery_fs + ":0", "reset", "snap"])
-        self.recovery_fs.table_tool([recovery_fs + ":0", "reset", "inode"])
-
-        # Stop the MDS
-        self.fs.mds_stop() # otherwise MDS will join once the fs is reset
+        workload.flush(self.fs)
          self.fs.fail()
  
          # After recovery, we need the MDS to not be strict about stats (in production these options
          # are off by default, but in QA we need to explicitly disable them)
+        # Note: these have to be written to ceph.conf to override existing ceph.conf values.
          self.fs.set_ceph_conf('mds', 'mds verify scatter', False)
          self.fs.set_ceph_conf('mds', 'mds debug scatterstat', False)
+        self.fs.mds_restart()
  
          # Apply any data damage the workload wants
-        workload.damage()
+        workload.damage(self.fs)
+
+        # Create the alternate pool if requested
+        recovery_fs = self.mds_cluster.newfs(name="recovery_fs", create=False)
+        recovery_fs.set_data_pool_name(self.fs.get_data_pool_name())
+        recovery_fs.create(recover=True, metadata_overlay=True)
+
+        recovery_pool = recovery_fs.get_metadata_pool_name()
+        recovery_fs.mon_manager.raw_cluster_cmd('-s')
  
          # Reset the MDS map in case multiple ranks were in play: recovery procedure
          # only understands how to rebuild metadata under rank 0
-        self.fs.reset()
-
-        self.fs.table_tool([self.fs.name + ":0", "reset", "session"])
-        self.fs.table_tool([self.fs.name + ":0", "reset", "snap"])
-        self.fs.table_tool([self.fs.name + ":0", "reset", "inode"])
+        #self.fs.reset()
+        #self.fs.table_tool([self.fs.name + ":0", "reset", "session"])
+        #self.fs.table_tool([self.fs.name + ":0", "reset", "snap"])
+        #self.fs.table_tool([self.fs.name + ":0", "reset", "inode"])
  
          # Run the recovery procedure
+        recovery_fs.data_scan(['init', '--force-init',
+                               '--filesystem', recovery_fs.name,
+                               '--alternate-pool', recovery_pool])
+        recovery_fs.table_tool([recovery_fs.name + ":0", "reset", "session"])
+        recovery_fs.table_tool([recovery_fs.name + ":0", "reset", "snap"])
+        recovery_fs.table_tool([recovery_fs.name + ":0", "reset", "inode"])
          if False:
              with self.assertRaises(CommandFailedError):
                  # Normal reset should fail when no objects are present, we'll use --force instead
                  self.fs.journal_tool(["journal", "reset"], 0)
  
-        self.fs.data_scan(['scan_extents', '--alternate-pool',
+        recovery_fs.data_scan(['scan_extents', '--alternate-pool',
                             recovery_pool, '--filesystem', self.fs.name,
                             self.fs.get_data_pool_name()])
-        self.fs.data_scan(['scan_inodes', '--alternate-pool',
+        recovery_fs.data_scan(['scan_inodes', '--alternate-pool',
                             recovery_pool, '--filesystem', self.fs.name,
                             '--force-corrupt', '--force-init',
                             self.fs.get_data_pool_name()])
-        self.fs.journal_tool(['event', 'recover_dentries', 'list',
+        recovery_fs.data_scan(['scan_links', '--filesystem', recovery_fs.name])
+        recovery_fs.journal_tool(['event', 'recover_dentries', 'list',
                                '--alternate-pool', recovery_pool], 0)
-
-        self.fs.data_scan(['init', '--force-init', '--filesystem',
-                           self.fs.name])
-        self.fs.data_scan(['scan_inodes', '--filesystem', self.fs.name,
-                           '--force-corrupt', '--force-init',
-                           self.fs.get_data_pool_name()])
-        self.fs.journal_tool(['event', 'recover_dentries', 'list'], 0)
-
-        self.recovery_fs.journal_tool(['journal', 'reset', '--force'], 0)
-        self.fs.journal_tool(['journal', 'reset', '--force'], 0)
-        self.fs.mon_manager.raw_cluster_cmd('mds', 'repaired',
-                                            recovery_fs + ":0")
-
-        # Mark the MDS repaired
-        self.fs.mon_manager.raw_cluster_cmd('mds', 'repaired', '0')
+        recovery_fs.journal_tool(["journal", "reset", "--force"], 0)
  
          # Start the MDS
-        self.fs.mds_restart()
-        self.fs.set_joinable()
-        self.recovery_fs.mds_restart()
-        self.fs.wait_for_daemons()
-        self.recovery_fs.wait_for_daemons()
-        status = self.recovery_fs.status()
-        for rank in self.recovery_fs.get_ranks(status=status):
-            self.fs.mon_manager.raw_cluster_cmd('tell', "mds." + rank['name'],
-                                                'injectargs', '--debug-mds=20')
-            self.fs.rank_tell(['scrub', 'start', '/', 'recursive,repair'], rank=rank['rank'], status=status)
-        log.info(str(self.mds_cluster.status()))
+        recovery_fs.set_joinable()
+        status = recovery_fs.wait_for_daemons()
+
+        self.config_set('mds', 'debug_mds', '20')
+        for rank in recovery_fs.get_ranks(status=status):
+            recovery_fs.rank_tell(['scrub', 'start', '/', 'force,recursive,repair'], rank=rank['rank'], status=status)
+        log.info(str(recovery_fs.status()))
  
          # Mount a client
-        self.mount_a.mount_wait()
-        self.mount_b.mount_wait(cephfs_name=recovery_fs)
+        self.mount_a.mount_wait(cephfs_name=recovery_fs.name)
  
          # See that the files are present and correct
-        errors = workload.validate()
+        errors = workload.validate(self.mount_a)
          if errors:
              log.error("Validation errors found: {0}".format(len(errors)))
              for e in errors:
@@ -199,5 +176,4 @@ class TestRecoveryPool(CephFSTestCase):
              ))
  
      def test_rebuild_simple(self):
-        self._rebuild_metadata(SimpleOverlayWorkload(self.fs, self.recovery_fs,
-                                                     self.mount_a, self.mount_b))
+        self._rebuild_metadata(SimpleOverlayWorkload())
author	Patrick Donnelly <pdonnell@redhat.com>
	Tue, 20 Sep 2022 14:57:01 +0000 (10:57 -0400)
committer	Patrick Donnelly <pdonnell@redhat.com>
	Tue, 4 Apr 2023 12:50:44 +0000 (08:50 -0400)
qa/tasks/cephfs/cephfs_test_case.py		patch \| blob \| history
qa/tasks/cephfs/filesystem.py		patch \| blob \| history
qa/tasks/cephfs/test_recovery_pool.py		patch \| blob \| history