3aefa9f0c16d392f94821222d09bf65f240b09e8
[xfstests-dev.git] / tests / generic / 454
1 #! /bin/bash
2 # SPDX-License-Identifier: GPL-2.0
3 # Copyright (c) 2017, Oracle and/or its affiliates.  All Rights Reserved.
4 #
5 # FS QA Test No. 454
6 #
7 # Create xattrs with multiple keys that all appear the same
8 # (in unicode, anyway) but point to different values.  In theory all
9 # Linux filesystems should allow this (filenames are a sequence of
10 # arbitrary bytes) even if the user implications are horrifying.
11 #
12 . ./common/preamble
13 _begin_fstest auto quick attr
14
15 # Import common functions.
16 . ./common/attr
17
18 _require_scratch
19 _require_attrs
20
21 echo "Format and mount"
22 _scratch_mkfs > $seqres.full 2>&1
23 _scratch_mount >> $seqres.full 2>&1
24
25 testdir="${SCRATCH_MNT}/test-${seq}"
26 mkdir $testdir
27 testfile="${testdir}/attrfile"
28 touch "${testfile}"
29
30 hexbytes() {
31         echo -n "$1" | od -tx1 -w99999 | head -n1 | sed -e 's/^0* //g'
32 }
33
34 setf() {
35         key="$(echo -e "$1")"
36         value="$2"
37
38         $SETFATTR_PROG -n "user.${key}" -v "${value}" "${testfile}" > $tmp.output 2>&1
39         if [ $? -ne 0 ]; then
40                 grep -q 'No space left on device' $tmp.output && \
41                         _notrun "ran out of space"
42                 cat $tmp.output
43         fi
44         echo "Storing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
45 }
46
47 testf() {
48         key="$(echo -e "$1")"
49         value="$2"
50
51         echo "Testing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
52
53         actual_value="$(_getfattr --absolute-names --only-values -n "user.${key}" "${testfile}")"
54         if [ "${actual_value}" != "${value}" ]; then
55                 echo "Key ${key} has value ${actual_value}, expected ${value}."
56         fi
57 }
58
59 filter_scrub() {
60         grep 'Unicode' | sed -e 's/^.*Duplicate/Duplicate/g'
61 }
62
63 echo "Create files"
64 # These two render the same
65 setf "french_caf\xc3\xa9.txt" "NFC"
66 setf "french_cafe\xcc\x81.txt" "NFD"
67
68 # These two may have different widths
69 setf "chinese_\xef\xbd\xb6.txt" "NFKC1"
70 setf "chinese_\xe3\x82\xab.txt" "NFKC2"
71
72 # Same point, different byte representations in NFC/NFD/NFKC/NFKD
73 setf "greek_\xcf\x93.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFC"
74 setf "greek_\xcf\x92\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFD"
75 setf "greek_\xce\x8e.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKC"
76 setf "greek_\xce\xa5\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKD"
77
78 # Arabic code point can expand into a muuuch longer series
79 setf "arabic_\xef\xb7\xba.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFC"
80 setf "arabic_\xd8\xb5\xd9\x84\xd9\x89\x20\xd8\xa7\xd9\x84\xd9\x84\xd9\x87\x20\xd8\xb9\xd9\x84\xd9\x8a\xd9\x87\x20\xd9\x88\xd8\xb3\xd9\x84\xd9\x85.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFKC"
81
82 # Fake slash?
83 setf "urk\xc0\xafmoo" "FAKESLASH"
84
85 # Emoji: octopus butterfly owl giraffe
86 setf "emoji_\xf0\x9f\xa6\x91\xf0\x9f\xa6\x8b\xf0\x9f\xa6\x89\xf0\x9f\xa6\x92.txt" "octopus butterfly owl giraffe emoji"
87
88 # Line draw characters, because why not?
89 setf "\x6c\x69\x6e\x65\x64\x72\x61\x77\x5f\x0a\xe2\x95\x94\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x97\x0a\xe2\x95\x91\x20\x6d\x65\x74\x61\x74\x61\x62\x6c\x65\x20\xe2\x95\x91\x0a\xe2\x95\x9f\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x95\xa2\x0a\xe2\x95\x91\x20\x5f\x5f\x69\x6e\x64\x65\x78\x20\x20\x20\xe2\x95\x91\x0a\xe2\x95\x9a\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x9d\x0a.txt" "ugly box because we can"
90
91 # unicode rtl widgets too...
92 setf "moo\xe2\x80\xaegnp.txt" "Well say hello,"
93 setf "mootxt.png" "Harvey"
94
95 # mixed-script confusables
96 setf "mixed_t\xce\xbfp.txt" "greek omicron instead of o"
97 setf "mixed_top.txt" "greek omicron instead of o"
98
99 # single-script spoofing
100 setf "hyphens_a\xe2\x80\x90b.txt" "hyphens"
101 setf "hyphens_a-b.txt" "hyphens"
102
103 setf "dz_digraph_dze.txt" "d-z digraph"
104 setf "dz_digraph_\xca\xa3e.txt" "d-z digraph"
105
106 # inadequate rendering
107 setf "inadequate_al.txt" "is it l or is it 1"
108 setf "inadequate_a1.txt" "is it l or is it 1"
109
110 # symbols
111 setf "prohibition_Rs.txt" "rupee symbol"
112 setf "prohibition_\xe2\x82\xa8.txt" "rupee symbol"
113
114 # zero width joiners
115 setf "zerojoin_moocow.txt" "zero width joiners"
116 setf "zerojoin_moo\xe2\x80\x8ccow.txt" "zero width joiners"
117
118 # combining marks
119 setf "combmark_\xe1\x80\x9c\xe1\x80\xad\xe1\x80\xaf.txt" "combining marks"
120 setf "combmark_\xe1\x80\x9c\xe1\x80\xaf\xe1\x80\xad.txt" "combining marks"
121
122 _getfattr --absolute-names -d "${testfile}" >> $seqres.full
123
124 echo "Test files"
125 testf "french_caf\xc3\xa9.txt" "NFC"
126 testf "french_cafe\xcc\x81.txt" "NFD"
127
128 testf "chinese_\xef\xbd\xb6.txt" "NFKC1"
129 testf "chinese_\xe3\x82\xab.txt" "NFKC2"
130
131 testf "greek_\xcf\x93.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFC"
132 testf "greek_\xcf\x92\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFD"
133 testf "greek_\xce\x8e.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKC"
134 testf "greek_\xce\xa5\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKD"
135
136 testf "arabic_\xef\xb7\xba.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFC"
137 testf "arabic_\xd8\xb5\xd9\x84\xd9\x89\x20\xd8\xa7\xd9\x84\xd9\x84\xd9\x87\x20\xd8\xb9\xd9\x84\xd9\x8a\xd9\x87\x20\xd9\x88\xd8\xb3\xd9\x84\xd9\x85.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFKC"
138
139 testf "urk\xc0\xafmoo" "FAKESLASH"
140
141 testf "emoji_\xf0\x9f\xa6\x91\xf0\x9f\xa6\x8b\xf0\x9f\xa6\x89\xf0\x9f\xa6\x92.txt" "octopus butterfly owl giraffe emoji"
142
143 testf "\x6c\x69\x6e\x65\x64\x72\x61\x77\x5f\x0a\xe2\x95\x94\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x97\x0a\xe2\x95\x91\x20\x6d\x65\x74\x61\x74\x61\x62\x6c\x65\x20\xe2\x95\x91\x0a\xe2\x95\x9f\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x95\xa2\x0a\xe2\x95\x91\x20\x5f\x5f\x69\x6e\x64\x65\x78\x20\x20\x20\xe2\x95\x91\x0a\xe2\x95\x9a\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x9d\x0a.txt" "ugly box because we can"
144
145 testf "moo\xe2\x80\xaegnp.txt" "Well say hello,"
146 testf "mootxt.png" "Harvey"
147
148 testf "mixed_t\xce\xbfp.txt" "greek omicron instead of o"
149 testf "mixed_top.txt" "greek omicron instead of o"
150
151 testf "hyphens_a\xe2\x80\x90b.txt" "hyphens"
152 testf "hyphens_a-b.txt" "hyphens"
153
154 testf "dz_digraph_dze.txt" "d-z digraph"
155 testf "dz_digraph_\xca\xa3e.txt" "d-z digraph"
156
157 testf "inadequate_al.txt" "is it l or is it 1"
158 testf "inadequate_a1.txt" "is it l or is it 1"
159
160 testf "prohibition_Rs.txt" "rupee symbol"
161 testf "prohibition_\xe2\x82\xa8.txt" "rupee symbol"
162
163 testf "zerojoin_moocow.txt" "zero width joiners"
164 testf "zerojoin_moo\xe2\x80\x8ccow.txt" "zero width joiners"
165
166 testf "combmark_\xe1\x80\x9c\xe1\x80\xad\xe1\x80\xaf.txt" "combining marks"
167 testf "combmark_\xe1\x80\x9c\xe1\x80\xaf\xe1\x80\xad.txt" "combining marks"
168
169 echo "Uniqueness of keys?"
170 crazy_keys="$(_getfattr --absolute-names -d "${testfile}" | egrep -c '(french_|chinese_|greek_|arabic_|urk)')"
171 expected_keys=11
172 test "${crazy_keys}" -ne "${expected_keys}" && echo "Expected ${expected_keys} keys, saw ${crazy_keys}."
173
174 echo "Test XFS online scrub, if applicable"
175
176 if _check_xfs_scrub_does_unicode "$SCRATCH_MNT" "$SCRATCH_DEV"; then
177         output="$(LC_ALL="C.UTF-8" ${XFS_SCRUB_PROG} -v -n "${SCRATCH_MNT}" 2>&1 | filter_scrub)"
178         echo "${output}" | grep -q "french_" || echo "No complaints about french e accent?"
179         echo "${output}" | grep -q "greek_" || echo "No complaints about greek letter mess?"
180         echo "${output}" | grep -q "arabic_" || echo "No complaints about arabic expanded string?"
181         echo "${output}" | grep -q "mixed_" || echo "No complaints about mixed script confusables?"
182         echo "${output}" | grep -q "hyphens_" || echo "No complaints about hyphenation confusables?"
183         echo "${output}" | grep -q "dz_digraph_" || echo "No complaints about single script confusables?"
184         echo "${output}" | grep -q "inadequate_" || echo "No complaints about inadequate rendering confusables?"
185         echo "${output}" | grep -q "prohibition_" || echo "No complaints about prohibited sequence confusables?"
186         echo "${output}" | grep -q "zerojoin_" || echo "No complaints about zero-width join confusables?"
187         echo "Actual xfs_scrub output:" >> $seqres.full
188         echo "${output}" >> $seqres.full
189 fi
190
191 # success, all done
192 status=0
193 exit