java - 从 Java 输入流中读取下一个字符(完整的 unicode 代码点)

标签 java utf-8

我需要逐个字符地解析 UTF-8 输入(来自文本文件)(按字符我指的是完整的 UTF-8 字符(UTF-8 代码点),而不是 Java 的字符)。

我应该使用什么方法?

最佳答案

CharSequence.codePoints()

例如:

String text = Files.readString(Path.of("test.txt"));

IntStream codePoints = text.codePoints();

// do something with the code points
codePoints.forEach(codePoint -> System.out.println(codePoint));

关于java - 从 Java 输入流中读取下一个字符(完整的 unicode 代码点),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26391790/

相关文章:

java - 只读 EnumSet 迭代器线程安全吗?

python - Unicode解码错误: 'ascii' codec can't decode byte 0xa3

java - 我是否必须将一个类声明为公共(public)(它是程序中唯一没有人会使用的类)

java - subString结合for循环的做法

java - 如何在命令行参数中使用省略号?

java - HTML : Form does not send UTF-8 format inputs

java - 如何将java字符串转换为不同语言

java - 如何显示选中的复选框? Spring-Jsp

python - 应用了 base64 解码的数据在 json.loads() 中出错

haskell - 在 Macos 终端上输出 UTF-8 字符串