bash - 为什么 bash 在对 C 风格字符串的内容进行循环时忽略换行符?

标签 bash scripting for-loop escaping

为什么下面...

c=0; for i in $'1\n2\n3\n4'; do echo iteration $c :$i:; c=$[c+1]; done

打印出来...

iteration 0 :1 2 3 4:

不是

iteration 0 :1:
iteration 1 :2:
iteration 2 :3:
iteration 3 :4:

据我所知,$'STRING' 语法应该允许我指定一个带有转义字符的字符串。不应该将“\n”解释为换行符以便 for 循环回显四次,每行一次?相反,换行符似乎被解释为空格字符。

我采纳了 unwind 的建议并尝试设置 $IFS。结果是一样的。

IFS=$'\n'; c=0; for i in $'1\n2\n3\n4'; do echo iteration $c :$i:; c=$[c+1]; done; unset IFS;

iteration 0 :1 2 3 4:

William Purssel 在评论中说这没有用,因为 IFS 被设置为换行......但跟随没有用。

IFS=' '; c=0; for i in '1 2 3 4'; do echo iteration $c :$i:; c=$[c+1]; done; unset IFS;

iteration 0 :1 2 3 4:

在换行符分隔的字符串上使用 IFS=' ' 会导致更加困惑...

IFS=' '; c=0; for i in $'1\n2\n3\n4'; do echo iteration $c :$i:; c=$[c+1]; done; unset IFS;

iteration 0 :1
2
3
4:

将 IFS 设置为 '\n' 而不是 $'\n' 与 IFS=' ' ... 具有相同的效果

IFS='\n'; c=0; for i in $'1\n2\n3\n4'; do echo iteration $c :$i:; c=$[c+1]; done; unset IFS;

iteration 0 :1
2
3
4:

只有一次迭代,但出于某种原因,换行符在回显中可见。

起作用的是首先将字符串存储在一个变量中,然后循环遍历变量的内容(无需设置 IFS):

c=0; v=$'1\n2\n3\n4'; for i in $v; do echo iteration $c :$i:; c=$[c+1]; done

iteration 0 :1:
iteration 1 :2:
iteration 2 :3:
iteration 3 :4:

还是没有解释为什么会出现这个问题。

这里有规律吗?这是 unwind 链接中定义的 IFS 的预期行为吗?

unwind 的链接状态...“shell 扫描参数扩展、命令替换和算术扩展的结果,这些结果没有出现在双引号内以进行分词。”

我想这可以解释为什么无论使用什么转义字符,字符串文字都不会在 for 循环迭代中被拆分。只有当文字被分配给一个变量时,该变量才被扩展为 for 循环拆分,它才起作用。我想还有命令替换。

例子:

命令替换结果拆分

c=0; for i in `echo $'1\n2\n3\n4'`; do echo iteration $c :$i:; c=$[c+1]; done

iteration 0 :1:
iteration 1 :2:
iteration 2 :3:
iteration 3 :4:

被扩展的字符串部分被分割,其余部分没有。

c=0; v=$'1 \n\t2\t3 4'; for i in $v$'\n5\n6'; do echo iteration $c :$i:; c=$[c+1]; done

iteration 0 :1:
iteration 1 :2:
iteration 2 :3:
iteration 3 :4 5 6:

当在双引号中展开时,不会发生拆分。

c=0; v=$'1\n2\n3 4'; for i in "$v"; do echo iteration $c :$i:; c=$[c+1]; done

iteration 0 :1 2 3 4:

SPACE, TAB, NEWLINE 的任意顺序作为分割的分隔符。

c=0; v=$'1 2\t3 \t\n4'; for i in $v; do echo iteration $c :$i:; c=$[c+1]; done

iteration 0 :1:
iteration 1 :2:
iteration 2 :3:
iteration 3 :4:

我会接受 unwind 的回答,因为他的链接提供了我问题的答案。

不知道为什么 for 循环中的 echo 行为会随着 IFS 的值而变化。

编辑:扩展以澄清。

最佳答案

在此上下文中,Bash 不会对引用的字符串进行单词扩展。例如:

$ for i in "a b c d"; do echo $i; done
a b c d

$ for i in a b c d; do echo $i; done
a
b
c
d

$ var="a b c d"; for i in "$var"; do echo $i; done
a b c d

$ var="a b c d"; for i in $var; do echo $i; done
a
b
c
d

在评论中,您说“IFS='\n' 也有效。无效的是 IFS=$'\n'。我现在非常非常困惑。”

IFS='\n' 中,您将分隔符(复数)设置为反斜杠和“n”这两个字符。因此,如果您这样做(在“\n”的中间插入一个“X”),您就会看到会发生什么。尽管您在 $'' 中有它们,但它按字面意思处理“\n”序列:

$ IFS='\n'; for i in $'a\Xnb\nc\n'; do echo $i; done; rrifs
a X b
c

编辑 2(回应评论):

它将 '\n' 视为两个字符(不是换行符),将 $'a\Xnb\nc\n' 视为 10 个字符的文字字符串(不是换行符)然后 echo 输出字符串并将“\n”序列解释为换行符(因为字符串被“标记”用于解释),但由于它被引用它被视为一个字符串而不是分隔的单词通过 $IFS

尝试这些以进行进一步比较:

$ c=0; for i in "a\nb\nc\n"; do echo -e "iteration $c :$i:"; c=$[c+1]; done
iteration 0 :a
b
c
:

$ c=0; for i in "a\nb\nc\n"; do echo "iteration $c :$i:"; c=$[c+1]; done
iteration 0 :a\nb\nc\n:

$ c=0; for i in a\\nb\\nc\\n; do echo -e "iteration $c :$i:"; c=$[c+1]; done
iteration 0 :a
b
c
:

$ c=0; for i in a\\nb\\nc\\n; do echo "iteration $c :$i:"; c=$[c+1]; done
iteration 0 :a\nb\nc\n:

设置 IFS 对上述没有影响。

这是有效的(注意 $varfor 语句中没有被引用):

$ var=$'a\nb\nc\n'
$ saveIFS="$IFS"   # it's important to save and restore $IFS
$ IFS=$'\n'        # set $IFS to a newline using $'\n' (not '\n')
$ c=0; for i in $var; do echo -e "iteration $c :$i:"; c=$[c+1]; done
iteration 0 :a:
iteration 1 :b:
iteration 2 :c:
$ IFS="$saveIFS"

关于bash - 为什么 bash 在对 C 风格字符串的内容进行循环时忽略换行符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1650573/

相关文章:

java - 连续运行shell脚本时JVM进入休眠状态

bash - 如何获取括号中的值?

linux - BASH-查找相同大小的文件,使用 cksum,删除 dupe 但保留其名称作为符号链接(symbolic link)

json - 如何从 Powershell 脚本读取 JSON 数据并遍历它

javascript - 针对所有另一个数组过滤数组

linux - 在后台启动脚本时,我有两个进程正在运行

shell - 如何设置shell脚本的进程名?

javascript - 如何将数组项的单个值存储到父索引中?

java - 单for循环进入多列(JAVA)

bash - 如何递归查找目录中最新修改的文​​件?