java - 什么是\xHEX 字符?是否有它们的表格?

标签 java python c string generics

在读取文本文件时,我读取这些字符,当打印到控制台时,它输出空白或 �:

['\x80', '\xc3', '\x94', '\x99', '\x98','\x9d', '\x9c', '\xa9', '\xa6', '\xe2']

这些\xHEX 字符是什么?是否有指向表格的链接来查找这些字符?

已解决:

这不是一个 ascii 文本文件,它是一个 unicode utf8 文件。这就是为什么我无法正确识别字符。

对于 Java:

import java.io.*
File infile = new File('\home\foo\bar.txt');
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(infile), "UTF8"));
while ((str = in.readLine()) != null) {
System.out.println(str);
}

如果system.out.println提示尝试:

PrintStream out = new PrintStream(System.out, true, "UTF-8");
out.println(str);

对于 Python,简单地说:

import codecs
infile = '\home\foo\bar.txt'
reader = codecs.open(infile,'r','urf8')
for l in reader:
  print ln

最佳答案

这里是所有 unicode 字符的链接:

http://en.wikipedia.org/wiki/List_of_Unicode_characters

此外,如果您使用的是 Eclipse,请确保您的项目“文本文件编码”设置为 UTF-8。

项目->属性->资源->文本文件编码。

我对西里尔字母字符也有类似的问题:)

关于java - 什么是\xHEX 字符?是否有它们的表格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17783070/

相关文章:

java - 将音乐添加到 LibGDX 不起作用。收到错误消息,指出 newMusic 不是方法 最近还有其他人遇到此问题吗?

python - Mechanize [Errno 10054] 现有连接被远程主机强行关闭

c - 交换字符位并在交换后将其替换为新创建的字符

c - malloc问题和内存堆

java - 在java中使用DOM解析XML文件

java - 为什么需要处理消息的分片

Java心跳设计

c++ - 从 C 扩展跟踪 CPython 对象的生命周期

python - 生成器中的程序控制流程是怎样的?

c - 使用 CAPI 时是否有 ENGINE_load_private_key() 的替代品?