假设我收到用 MS Word 编写的西类牙语文本并保存为纯文本 (.txt)。不幸的是,所有西类牙口音都是这样显示的:
Un \372ltimo an\341lisis
谁能告诉我如何避免这种情况,或者至少如何替换这些字符?替换正则表达式函数根本找不到它们,否则我可以编写一个小 elisp 函数,用相关的西类牙语重音字符替换它们的每次出现。
最佳答案
这看起来像 ISO 8859-1 (Latin-1) 编码。
使用该编码系统访问文件。如果 Emacs 没有自动识别编码系统,您可以使用 revert-buffer-with-coding-system
(C-x RET r
) 重新访问具有显式编码系统的文件。
例如,如果您正在查看您所描述的乱码文件,
C-x RET r
latin-1 RET
yes RET
然后您可以设置要保存的编码系统(C-x RET f
)并指定诸如utf-8
之类的内容。
关于Emacs - 如何避免或替换错误的字符编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11073003/