我有一些来自文件命令行函数的行为。看起来它将空字节分类为数据文件,即使据我所知,我可以在网上找到的空字节是 UTF-8 的一部分。下面是我的问题的一个例子。
printf "你好\00,世界!"> 测试.txt
文件测试.txt
输出:test.txt:数据
为什么不将其归类为 UTF-8?
最佳答案
由于 0 字节,它被归类为通用数据,这不会出现在正常的人类可读文本中。如果你把它去掉,因为它只有可打印的 ASCII 字符,所以它会被归类为 ASCII,而不是 UTF-8。
关于linux - File(1) 将空字节分类为数据文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52402658/