55ddcc01b78a19b7958adda2d1d6f7a9dd6ae938
[xfstests-dev.git] / tests / generic / 453
1 #! /bin/bash
2 # SPDX-License-Identifier: GPL-2.0
3 # Copyright (c) 2017, Oracle and/or its affiliates.  All Rights Reserved.
4 #
5 # FS QA Test No. 453
6 #
7 # Create a directory with multiple filenames that all appear the same
8 # (in unicode, anyway) but point to different inodes.  In theory all
9 # Linux filesystems should allow this (filenames are a sequence of
10 # arbitrary bytes) even if the user implications are horrifying.
11 #
12 . ./common/preamble
13 _begin_fstest auto quick dir
14
15 # Import common functions.
16
17 _require_scratch
18
19 echo "Format and mount"
20 _scratch_mkfs > $seqres.full 2>&1
21 _scratch_mount >> $seqres.full 2>&1
22
23 testdir="${SCRATCH_MNT}/test-${seq}"
24 mkdir $testdir
25
26 hexbytes() {
27         echo -n "$1" | od -tx1 -w99999 | head -n1 | sed -e 's/^0* //g'
28 }
29
30 setf() {
31         key="$(echo -e "$1")"
32         value="$2"
33
34         echo "${value}" > "${testdir}/${key}"
35         echo "Storing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
36 }
37
38 setd() {
39         key="$(echo -e "$1")"
40         value="$2"
41
42         mkdir -p "${testdir}/${key}"
43         echo "${value}" > "${testdir}/${key}/value"
44         echo "Storing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
45 }
46
47 testf() {
48         key="$(echo -e "$1")"
49         value="$2"
50         fname="${testdir}/${key}"
51
52         echo "Testing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
53
54         if [ ! -e "${fname}" ]; then
55                 echo "Key ${key} does not exist for ${value} test??"
56                 return
57         fi
58
59         actual_value="$(cat "${fname}")"
60         if [ "${actual_value}" != "${value}" ]; then
61                 echo "Key ${key} has value ${value}, expected ${actual_value}."
62         fi
63 }
64
65 testd() {
66         key="$(echo -e "$1")"
67         value="$2"
68         fname="${testdir}/${key}/value"
69
70         echo "Testing ${key} ($(hexbytes "${key}")) -> ${value}" >> $seqres.full
71
72         if [ ! -e "${fname}" ]; then
73                 echo "Key ${key} does not exist for ${value} test??"
74                 return
75         fi
76
77         actual_value="$(cat "${fname}")"
78         if [ "${actual_value}" != "${value}" ]; then
79                 echo "Key ${key} has value ${value}, expected ${actual_value}."
80         fi
81 }
82
83 filter_scrub() {
84         grep 'Unicode' | sed -e 's/^.*Duplicate/Duplicate/g'
85 }
86
87 echo "Create files"
88 # These two render the same
89 setf "french_caf\xc3\xa9.txt" "NFC"
90 setf "french_cafe\xcc\x81.txt" "NFD"
91
92 # These two may have different widths
93 setf "chinese_\xef\xbd\xb6.txt" "NFKC1"
94 setf "chinese_\xe3\x82\xab.txt" "NFKC2"
95
96 # Same point, different byte representations in NFC/NFD/NFKC/NFKD
97 setf "greek_\xcf\x93.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFC"
98 setf "greek_\xcf\x92\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFD"
99 setf "greek_\xce\x8e.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKC"
100 setf "greek_\xce\xa5\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKD"
101
102 # Arabic code point can expand into a muuuch longer series
103 setf "arabic_\xef\xb7\xba.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFC"
104 setf "arabic_\xd8\xb5\xd9\x84\xd9\x89\x20\xd8\xa7\xd9\x84\xd9\x84\xd9\x87\x20\xd8\xb9\xd9\x84\xd9\x8a\xd9\x87\x20\xd9\x88\xd8\xb3\xd9\x84\xd9\x85.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFKC"
105
106 # Fake slash?
107 setf "urk\xc0\xafmoo" "FAKESLASH"
108
109 # Emoji: octopus butterfly owl giraffe
110 setf "emoji_\xf0\x9f\xa6\x91\xf0\x9f\xa6\x8b\xf0\x9f\xa6\x89\xf0\x9f\xa6\x92.txt" "octopus butterfly owl giraffe emoji"
111
112 # Line draw characters, because why not?
113 setf "\x6c\x69\x6e\x65\x64\x72\x61\x77\x5f\x0a\xe2\x95\x94\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x97\x0a\xe2\x95\x91\x20\x6d\x65\x74\x61\x74\x61\x62\x6c\x65\x20\xe2\x95\x91\x0a\xe2\x95\x9f\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x95\xa2\x0a\xe2\x95\x91\x20\x5f\x5f\x69\x6e\x64\x65\x78\x20\x20\x20\xe2\x95\x91\x0a\xe2\x95\x9a\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x9d\x0a.txt" "ugly box because we can"
114
115 # unicode rtl widgets too...
116 setf "moo\xe2\x80\xaegnp.txt" "Well say hello,"
117 setf "mootxt.png" "Harvey"
118
119 # mixed-script confusables
120 setf "mixed_t\xce\xbfp.txt" "greek omicron instead of o"
121 setf "mixed_top.txt" "greek omicron instead of o"
122
123 # single-script spoofing
124 setf "hyphens_a\xe2\x80\x90b.txt" "hyphens"
125 setf "hyphens_a-b.txt" "hyphens"
126
127 setf "dz_digraph_dze.txt" "d-z digraph"
128 setf "dz_digraph_\xca\xa3e.txt" "d-z digraph"
129
130 # inadequate rendering
131 setf "inadequate_al.txt" "is it l or is it 1"
132 setf "inadequate_a1.txt" "is it l or is it 1"
133
134 # symbols
135 setf "prohibition_Rs.txt" "rupee symbol"
136 setf "prohibition_\xe2\x82\xa8.txt" "rupee symbol"
137
138 # zero width joiners
139 setf "zerojoin_moocow.txt" "zero width joiners"
140 setf "zerojoin_moo\xe2\x80\x8dcow.txt" "zero width joiners"
141
142 # combining marks
143 setf "combmark_\xe1\x80\x9c\xe1\x80\xad\xe1\x80\xaf.txt" "combining marks"
144 setf "combmark_\xe1\x80\x9c\xe1\x80\xaf\xe1\x80\xad.txt" "combining marks"
145
146 # fake dotdot entry
147 setd ".\xe2\x80\x8d" "zero width joiners in dot entry"
148 setd "..\xe2\x80\x8d" "zero width joiners in dotdot entry"
149
150 ls -la $testdir >> $seqres.full
151
152 echo "Test files"
153 testf "french_caf\xc3\xa9.txt" "NFC"
154 testf "french_cafe\xcc\x81.txt" "NFD"
155
156 testf "chinese_\xef\xbd\xb6.txt" "NFKC1"
157 testf "chinese_\xe3\x82\xab.txt" "NFKC2"
158
159 testf "greek_\xcf\x93.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFC"
160 testf "greek_\xcf\x92\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFD"
161 testf "greek_\xce\x8e.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKC"
162 testf "greek_\xce\xa5\xcc\x81.txt" "GREEK UPSILON WITH ACUTE AND HOOK SYMBOL, NFKD"
163
164 testf "arabic_\xef\xb7\xba.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFC"
165 testf "arabic_\xd8\xb5\xd9\x84\xd9\x89\x20\xd8\xa7\xd9\x84\xd9\x84\xd9\x87\x20\xd8\xb9\xd9\x84\xd9\x8a\xd9\x87\x20\xd9\x88\xd8\xb3\xd9\x84\xd9\x85.txt" "ARABIC LIGATURE SALLALLAHOU ALAYHE WASALLAM, NFKC"
166
167 testf "urk\xc0\xafmoo" "FAKESLASH"
168
169 testf "emoji_\xf0\x9f\xa6\x91\xf0\x9f\xa6\x8b\xf0\x9f\xa6\x89\xf0\x9f\xa6\x92.txt" "octopus butterfly owl giraffe emoji"
170
171 testf "\x6c\x69\x6e\x65\x64\x72\x61\x77\x5f\x0a\xe2\x95\x94\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x97\x0a\xe2\x95\x91\x20\x6d\x65\x74\x61\x74\x61\x62\x6c\x65\x20\xe2\x95\x91\x0a\xe2\x95\x9f\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x95\xa2\x0a\xe2\x95\x91\x20\x5f\x5f\x69\x6e\x64\x65\x78\x20\x20\x20\xe2\x95\x91\x0a\xe2\x95\x9a\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x90\xe2\x95\x9d\x0a.txt" "ugly box because we can"
172
173 testf "moo\xe2\x80\xaegnp.txt" "Well say hello,"
174 testf "mootxt.png" "Harvey"
175
176 testf "mixed_t\xce\xbfp.txt" "greek omicron instead of o"
177 testf "mixed_top.txt" "greek omicron instead of o"
178
179 testf "hyphens_a\xe2\x80\x90b.txt" "hyphens"
180 testf "hyphens_a-b.txt" "hyphens"
181
182 testf "dz_digraph_dze.txt" "d-z digraph"
183 testf "dz_digraph_\xca\xa3e.txt" "d-z digraph"
184
185 testf "inadequate_al.txt" "is it l or is it 1"
186 testf "inadequate_a1.txt" "is it l or is it 1"
187
188 testf "prohibition_Rs.txt" "rupee symbol"
189 testf "prohibition_\xe2\x82\xa8.txt" "rupee symbol"
190
191 testf "zerojoin_moocow.txt" "zero width joiners"
192 testf "zerojoin_moo\xe2\x80\x8dcow.txt" "zero width joiners"
193
194 testf "combmark_\xe1\x80\x9c\xe1\x80\xad\xe1\x80\xaf.txt" "combining marks"
195 testf "combmark_\xe1\x80\x9c\xe1\x80\xaf\xe1\x80\xad.txt" "combining marks"
196
197 testd ".\xe2\x80\x8d" "zero width joiners in dot entry"
198 testd "..\xe2\x80\x8d" "zero width joiners in dotdot entry"
199
200 echo "Uniqueness of inodes?"
201 stat -c '%i' "${testdir}/"* | sort | uniq -c | while read nr inum; do
202         if [ "${nr}" -gt 1 ]; then
203                 echo "${nr} ${inum}"
204         fi
205 done
206
207 echo "Test XFS online scrub, if applicable"
208
209 if _check_xfs_scrub_does_unicode "$SCRATCH_MNT" "$SCRATCH_DEV"; then
210         output="$(LC_ALL="C.UTF-8" ${XFS_SCRUB_PROG} -v -n "${SCRATCH_MNT}" 2>&1 | filter_scrub)"
211         echo "${output}" | grep -q "french_" || echo "No complaints about french e accent?"
212         echo "${output}" | grep -q "greek_" || echo "No complaints about greek letter mess?"
213         echo "${output}" | grep -q "arabic_" || echo "No complaints about arabic expanded string?"
214         echo "${output}" | grep -q "mixed_" || echo "No complaints about mixed script confusables?"
215         echo "${output}" | grep -q "hyphens_" || echo "No complaints about hyphenation confusables?"
216         echo "${output}" | grep -q "dz_digraph_" || echo "No complaints about single script confusables?"
217         echo "${output}" | grep -q "inadequate_" || echo "No complaints about inadequate rendering confusables?"
218         echo "${output}" | grep -q "prohibition_" || echo "No complaints about prohibited sequence confusables?"
219         echo "${output}" | grep -q "zerojoin_" || echo "No complaints about zero-width join confusables?"
220         echo "Actual xfs_scrub output:" >> $seqres.full
221         echo "${output}" >> $seqres.full
222 fi
223
224 # success, all done
225 status=0
226 exit