qa/tasks/nvmeof.py: Fix do_checks() method

author Vallari Agrawal <vallari.agrawal@ibm.com>

Tue, 28 Jan 2025 09:18:15 +0000 (14:48 +0530)

committer Vallari Agrawal <vallari.agrawal@ibm.com>

Thu, 30 Jan 2025 12:17:00 +0000 (17:47 +0530)
author Vallari Agrawal <vallari.agrawal@ibm.com>
Tue, 28 Jan 2025 09:18:15 +0000 (14:48 +0530)
committer Vallari Agrawal <vallari.agrawal@ibm.com>
Thu, 30 Jan 2025 12:17:00 +0000 (17:47 +0530)
diff --git a/qa/tasks/nvmeof.py b/qa/tasks/nvmeof.py

index 33cb51b8c01fa84378d60ce8737e6588a8b4b626..aeca32f1b657c63730ded2f35416bbbb942e086e 100644 (file)
--- a/qa/tasks/nvmeof.py
+++ b/qa/tasks/nvmeof.py
@@ -346,24 +346,29 @@ class NvmeofThrasher(Thrasher, Greenlet):
          Run some checks to see if everything is running well during thrashing.
          """
          self.log('display and verify stats:')
-        for d in self.daemons:
-            d.remote.sh(d.status_cmd, check_status=False)
-        check_cmd = [
-            'ceph', 'orch', 'ls', '--refresh',
-            run.Raw('&&'), 'ceph', 'orch', 'ps', '--daemon-type', 'nvmeof', '--refresh',
-            run.Raw('&&'), 'ceph', 'health', 'detail',
-            run.Raw('&&'), 'ceph', '-s',
-            run.Raw('&&'), 'ceph', 'nvme-gw', 'show', 'mypool', 'mygroup0',
-            run.Raw('&&'), 'sudo', 'nvme', 'list',
-        ]
-        self.checker_host.run(args=check_cmd).wait()
-
-        for dev in self.devices:
-            device_check_cmd = [
-                'sudo', 'nvme', 'list-subsys', dev,
-                run.Raw('|'), 'grep', 'live optimized'
-            ]
-            self.checker_host.run(args=device_check_cmd)    
+        for retry in range(5):
+            try: 
+                random_gateway_host = None
+                initiator_host = self.checker_host 
+                for d in self.daemons:
+                    random_gateway_host = d.remote
+                    d.remote.sh(d.status_cmd, check_status=False)
+                random_gateway_host.run(args=['ceph', 'orch', 'ls', '--refresh'])
+                random_gateway_host.run(args=['ceph', 'orch', 'ps', '--daemon-type', 'nvmeof', '--refresh'])
+                random_gateway_host.run(args=['ceph', 'health', 'detail'])
+                random_gateway_host.run(args=['ceph', '-s'])
+                random_gateway_host.run(args=['ceph', 'nvme-gw', 'show', 'mypool', 'mygroup0'])
+
+                initiator_host.run(args=['sudo', 'nvme', 'list'])
+                for dev in self.devices:
+                    device_check_cmd = [
+                        'sudo', 'nvme', 'list-subsys', dev,
+                        run.Raw('|'), 'grep', 'live optimized'
+                    ]
+                    initiator_host.run(args=device_check_cmd)
+                break
+            except run.CommandFailedError:
+                self.log(f"retry do_checks() for {retry} time")
  
      def switch_task(self):
          """
author	Vallari Agrawal <vallari.agrawal@ibm.com>
	Tue, 28 Jan 2025 09:18:15 +0000 (14:48 +0530)
committer	Vallari Agrawal <vallari.agrawal@ibm.com>
	Thu, 30 Jan 2025 12:17:00 +0000 (17:47 +0530)