language-agnostic -\r\n 作为 UTF8 字符的一部分？

标签 language-agnostic unicode character-encoding

是否有可能某些 UTF8 符号包含字节 0x0D 0x0A 作为其一部分？如果是，这些符号是什么？
(我要解决的任务是从某个点而不是从头开始读取文本 UTF8 文件)

最佳答案

不，多字节编码代码点的每个字节都将始终设置最高有效位。

UTF-8 流中值为 0-127 的字节被唯一映射到 ASCII。

关于language-agnostic -\r\n 作为 UTF8 字符的一部分？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9226785/

上一篇：objective-c - 在 float 和 double 之间重复转换是否有任何开销

下一篇：PowerShell 将 1 天添加到 AD 用户的 AccountExpire 属性

相关文章：

Java 替换字符串中的 Unicode 字符

c++ - 为什么此文件中的字符在C++(VS2017)中读为负字符代码？

java - 如何使用扫描仪以正确的方式从文件中读取重音字符？

C++ 11:普通字符串文字和UTF-8字符串文字之间的区别示例？

c++ - 为什么C++中的 `const char *`类型可以存储Unicode？

language-agnostic - 网络服务器是否可以确定它是否是 HA 故障转移系统的事件节点，而无需在服务器本身上硬编码任何内容？

language-agnostic - 如何重构一个庞大而困惑的代码库？

security - 您在编写自己的密码学方法时使用哪些技术？

language-agnostic - 百分比、百分比、分数、比例因子的术语？

objective-c - 在 iOS 上显示克林贡文本

©2024 IT工具网联系我们