linux - utf-8 文件显示双字符

标签 linux unicode

生成的 utf-8 文件在终端中正确显示: alt text

但不是在 Firefox 或 gedit 中: alt text

看起来字符与奇怪的字符翻倍?

文件: http://maestric.com/shared/other/2004_10_14.txt

知道它有什么问题吗?

最佳答案

好像是UTF-16。您确定您的语言环境和终端是 UTF-8 格式吗?

您是否在文件上尝试了“od”,或者在十六进制查看器中看到了它?永远不要相信您的终端,您必须查看字节才能确定。

例如

# od -c -x 2004_10_14.txt  | head
0000000  \0   H  \0   e  \0   u  \0   r  \0   e  \0      \0   d  \0   e
        4800 6500 7500 7200 6500 2000 6400 6500
0000020  \0      \0   d  \0 303 251  \0   b  \0   u  \0   t  \0      \0
        2000 6400 c300 00a9 0062 0075 0074 0020

关于linux - utf-8 文件显示双字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3884559/

相关文章:

Linux 内核 : copy_from_user - struct with pointers

c# - 切换到 Linux Debian 上的程序

unicode - DB2 VARCHAR unicode 数据存储

sorting - 使用 LDML 文件中指定的整理顺序进行行排序

c++ - 我如何在不使用 out 扩展名的情况下给出命令行参数,而不是 ./a.out 3 4 而是像 ./a 3 4

linux - 在Redhat服务器上,是否可以在线增加/var,如何增加?

SQL Server对unicode字符的唯一约束问题

php - 如何从字符串中删除零宽度非连接器?

linux - 在 Linux 中 Grep 字符串

regex - 如何使用 sublime text 中的代码点搜索 unicode 字符