btrfs/011: continue the test if we failed to cancel the replace
authorQu Wenruo <wqu@suse.com>
Tue, 11 Jan 2022 00:36:46 +0000 (08:36 +0800)
committerEryu Guan <guaneryu@gmail.com>
Sun, 16 Jan 2022 04:36:44 +0000 (12:36 +0800)
Btrfs/011 test case has exposed quite some bugs in the past, but it also
has some tendency to cause false alert, as its way testing replace
cancel require the replace to be still running when we send the cancel
request.

But on a lot of cases, the replace can finish way faster than the wait
time, and cause false alert.

Commit fa85aa64 ("btrfs/011: Fill the fs to ensure we have enough data for
dev-replace") tries to address the problem by filling the fs, but there
is still no guarantee.

Although there is still some discussion on how to properly solve the
problem, there is one thing sure that we should continue the test
instead of abort, if the replace cancel failed.

A quick abort caused by finished replace will leave other profiles
untested, reducing the coverage.

This patch will still mark the test failed for a finished replace, but
at least ensure we have run the test for all the profiles.

Signed-off-by: Qu Wenruo <wqu@suse.com>
Reviewed-by: Eryu Guan <guaneryu@gmail.com>
Signed-off-by: Eryu Guan <guaneryu@gmail.com>
tests/btrfs/011

index b4673341c24ba6e00a96e4f844b829efa6a50bd8..05ea96b94471f657b68efd1f48b8a633a6df96e5 100755 (executable)
@@ -171,13 +171,25 @@ btrfs_replace_test()
                # background the replace operation (no '-B' option given)
                _run_btrfs_util_prog replace start -f $replace_options $source_dev $target_dev $SCRATCH_MNT
                sleep $wait_time
-               _run_btrfs_util_prog replace cancel $SCRATCH_MNT
+               $BTRFS_UTIL_PROG replace cancel $SCRATCH_MNT 2>&1 >> $seqres.full
 
                # 'replace status' waits for the replace operation to finish
                # before the status is printed
                $BTRFS_UTIL_PROG replace status $SCRATCH_MNT > $tmp.tmp 2>&1
                cat $tmp.tmp >> $seqres.full
-               grep -q canceled $tmp.tmp || _fail "btrfs replace status (canceled) failed"
+
+               # If the replace is finished, we need to replace $source_dev
+               # back with $target_dev, or later fsck will fail and abort
+               # the test, reducing the coverage.
+               if grep -q finished $tmp.tmp ; then
+                       $BTRFS_UTIL_PROG replace start -Bf $target_dev \
+                               $source_dev $SCRATCH_MNT > /dev/null
+               fi
+
+               # For above finished case, we still output the error message
+               # but continue the test, or later profiles won't get tested
+               # at all.
+               grep -q canceled $tmp.tmp || echo "btrfs replace status (canceled) failed"
        else
                if [ "${quick}Q" = "thoroughQ" ]; then
                        # The thorough test runs around 2 * $wait_time seconds.