我想知道 Windows 如何解释字符。
我用十六进制编辑器创建了一个包含 3 个字节 E3 81 81
的文件。
这些字节是 UTF-8 中的 ぁ
字符。
我打开记事本,它显示ぁ
。我没有指定文件的编码,我只是创建了字节,记事本正确地解释了它。
记事本是否以某种方式猜测编码?
或者十六进制编辑器是否使用特定编码保存这些字节?
最佳答案
如果文件只包含这三个字节,则根本没有关于使用哪种编码的信息。
一个字节就是一个字节,没有办法在其中包含任何编码信息。此外,十六进制编辑器甚至不知道您打算将数据解码为文本。
记事本通常使用 ANSI 编码,因此如果它以 UTF-8 格式读取文件,则它必须根据文件中的数据猜测编码。
如果您将文件保存为 UTF-8,记事本会将 BOM(字节顺序标记)EF BB BF
放在文件的开头。
关于windows - Windows 记事本如何解释字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6769311/