c++ - 从 utf 8 混合中分离繁体中文字符

标签 c++ c utf-8

我正在用 C/C++ 编写一个程序,它接受用户的输入。输入是一个utf-8字符串,可能会混合英文、中文和一些标点符号。

我的程序必须将这些汉字与英文字符分开。

众所周知,汉字占2个字节,英文只占1个字节。我无法迭代 char 数组来查找是否存在任何英文字符。知道如何解决这个问题吗?

最佳答案

获取 ICU4C 并使用它按字符进行迭代。

关于c++ - 从 utf 8 混合中分离繁体中文字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8681197/

相关文章:

c++ - 如何在C++中比较两个文本文件

java - 以编程方式从内置摄像头捕获视频

c++ - Visual Studio 2019 测试资源管理器没有找到 c++ google 测试

c++ - 为什么或为什么不应该使用 'UL' 来指定 unsigned long?

c - 为具有多个接口(interface)的设备设置 MTU

c++ - Visual C++ 从 C++ 引用 C 函数

c - 读取 csv 文件并存储在缓冲区中时出现问题

php mysql查询字符集

php - cURL 获取带有 utf-8 BOM 的响应

python - 不能在 ubuntu docker 容器中写 ñ, ä, ë, ü