linux - 关于文件编码猜测,file 或 nkf,哪个 linux 命令是可信的?

标签 linux encoding utf-8

文件编码结果因nkf 和文件而异。哪个值得信赖?

$ nkf -g test
EUC-JP

$ file -I test
test: text/plain; charset=utf-8

这是文件内容。

$ cat test
Móviles

所以,我用nkf将它的编码转换为utf-8,结果出现了乱码。

$ nkf -w test
M坦viles

所以,这个文件似乎是EUC-JP。但为什么 file 命令将其显示为 utf-8

最佳答案

对于猜测文件编码,没有完美的方法来做到这一点,正如这个答案所示: https://unix.stackexchange.com/a/11648

要转换文件试试这个

iconv -f ENCODING_IN -t ENCODING_OUT(UTF-8) FILE_IN > FILE_OUT

关于linux - 关于文件编码猜测,file 或 nkf,哪个 linux 命令是可信的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24582921/

相关文章:

encoding - ffmpeg API h264编码的视频不能在所有平台上播放

java - 检查数据库中的字符串是否是用 Java 编码的 utf-8

java - 理解Java字符串编码/解码

c++ - 来自另一个后台进程的后台脚本的 pidof

linux - 是否可以在文件名中使用 "/"?

linux - 没有制定目标 `distclean' 的规则。编译openresty时停止

javascript - 将 UTF-8 编码的 JSON 从 DB 解析为 JS

Python 3.6 - 从文件中读取编码文本并转换为字符串

php - 为什么 jQuery 使用 UTF-16 进行 POSTing?

linux - Python3 linux 中的文件名编码问题