我在读取希伯来语的 UTF-8 编码文本文件时遇到问题。 我成功读取了所有希伯来字符,除了两个字母 = 'מ' 和 'א'。
这是我的阅读方式:
FileInputStream fstream = new FileInputStream(SCHOOLS_LIST_PATH);
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String strLine;
// Read File Line By Line
while ((strLine = br.readLine()) != null) {
if(strLine.contains("zevel")) {
continue;
}
schools.add(getSchoolFromLine(strLine));
}
有什么想法吗?
谢谢, 托默
最佳答案
您在使用 InputStreamReader 时未指定编码,因此它使用您平台的默认编码 - 这很可能不是是 UTF-8。
尝试:
new InputStreamReader(in, "UTF-8")
请注意,这里使用 DataInputStream
的原因并不明显...只需在 FileInputStream
周围创建一个 InputStreamReader
即可。
关于java - 使用Java从文本文件中读取希伯来语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5936231/