我使用 3rd 方工具以 Unicode 格式输出文件。但是,我更喜欢它是 ASCII。该工具没有更改文件格式的设置。
使用 Python 转换整个文件格式的最佳方法是什么?
最佳答案
您只需使用 unicode
即可轻松转换文件。函数,但是如果没有直接的 ASCII 等价物,您会遇到 Unicode 字符的问题。
This blog推荐<a href="http://www.python.org/doc/2.5.2/lib/module-unicodedata.html" rel="noreferrer noopener nofollow">unicodedata </a>
模块,它似乎负责粗略地转换没有直接对应 ASCII 值的字符,例如
>>> title = u"Klüft skräms inför på fédéral électoral große"
通常转换为
Klft skrms infr p fdral lectoral groe
这是非常错误的。但是,使用 unicodedata
模块,结果可以更接近原文:
>>> import unicodedata
>>> unicodedata.normalize('NFKD', title).encode('ascii','ignore')
'Kluft skrams infor pa federal electoral groe'
关于python - 如何使用 Python 将文件格式从 Unicode 转换为 ASCII?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/175240/