是否有可能某些 UTF8 符号包含字节 0x0D 0x0A 作为其一部分?如果是,这些符号是什么?
(我要解决的任务是从某个点而不是从头开始读取文本 UTF8 文件)
最佳答案
不,多字节编码代码点的每个字节都将始终设置最高有效位。
UTF-8 流中值为 0-127 的字节被唯一映射到 ASCII。
关于language-agnostic -\r\n 作为 UTF8 字符的一部分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9226785/