language-agnostic -\r\n 作为 UTF8 字符的一部分?

标签 language-agnostic unicode character-encoding

是否有可能某些 UTF8 符号包含字节 0x0D 0x0A 作为其一部分?如果是,这些符号是什么?
(我要解决的任务是从某个点而不是从头开始读取文本 UTF8 文件)

最佳答案

不,多字节编码代码点的每个字节都将始终设置最高有效位。

UTF-8 流中值为 0-127 的字节被唯一映射到 ASCII。

关于language-agnostic -\r\n 作为 UTF8 字符的一部分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9226785/

相关文章:

Java 替换字符串中的 Unicode 字符

c++ - 为什么此文件中的字符在C++(VS2017)中读为负字符代码?

java - 如何使用扫描仪以正确的方式从文件中读取重音字符?

C++ 11:普通字符串文字和UTF-8字符串文字之间的区别示例?

c++ - 为什么C++中的 `const char *`类型可以存储Unicode?

language-agnostic - 网络服务器是否可以确定它是否是 HA 故障转移系统的事件节点,而无需在服务器本身上硬编码任何内容?

language-agnostic - 如何重构一个庞大而困惑的代码库?

security - 您在编写自己的密码学方法时使用哪些技术?

language-agnostic - 百分比、百分比、分数、比例因子的术语?

objective-c - 在 iOS 上显示克林贡文本