Emacs - 如何避免或替换错误的字符编码?

标签 emacs encoding utf-8 ms-word dos

假设我收到用 MS Word 编写的西类牙语文本并保存为纯文本 (.txt)。不幸的是,所有西类牙口音都是这样显示的:

Un \372ltimo an\341lisis

谁能告诉我如何避免这种情况,或者至少如何替换这些字符?替换正则表达式函数根本找不到它们,否则我可以编写一个小 elisp 函数,用相关的西类牙语重音字符替换它们的每次出现。

最佳答案

这看起来像 ISO 8859-1 (Latin-1) 编码。

使用该编码系统访问文件。如果 Emacs 没有自动识别编码系统,您可以使用 revert-buffer-with-coding-system (C-x RET r) 重新访问具有显式编码系统的文件。

例如,如果您正在查看您所描述的乱码文件,

C-x RET r
latin-1 RET
yes RET

然后您可以设置要保存的编码系统(C-x RET f)并指定诸如utf-8之类的内容。

关于Emacs - 如何避免或替换错误的字符编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11073003/

相关文章:

emacs - emacs 中的 "Programmer shortcuts"是什么?

emacs - 如何移动到 emacs 函数内部临时缓冲区的末尾

html - 将组织模式导出为 HTML : In-place coloring

python - 在python中解码十六进制utf8字符串

c# - HttpWebRequest 的响应不显示 UTF-8 符号

php - UTF-8贯穿始终

node.js - 在 emacs 中格式化 ejs 模板文件

javascript - encodeURIComponent算法源码

java - Java 中的平台相关编码问题

c# - 将流编码为 UTF-8 而不是 ASCII 后无法读取流中的整数