我正在用 C/C++ 编写一个程序,它接受用户的输入。输入是一个utf-8字符串,可能会混合英文、中文和一些标点符号。
我的程序必须将这些汉字与英文字符分开。
众所周知,汉字占2个字节,英文只占1个字节。我无法迭代 char 数组来查找是否存在任何英文字符。知道如何解决这个问题吗?
最佳答案
获取 ICU4C 并使用它按字符进行迭代。
关于c++ - 从 utf 8 混合中分离繁体中文字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8681197/