我在 OS X 10.5.5 上(尽管我想这并不重要)
我有一组带有奇特字符的文本文件,例如双反引号、省略号(“...”)在一个字符中等。
我需要将这些文件转换为良好的旧式纯 7 位 ASCII,最好不要丢失字符含义(即将这些省略号转换为三个句点,将反引号转换为通常的 "s 等)。
请建议一些智能命令行 (bash) 工具/脚本来执行此操作。
最佳答案
Elinks Web 浏览器会将 Unicode 实体转换为它们的 ASCII 等效项,例如“--”表示“—”,“...”表示“...”等。有一个 python 模块 python-elinks它使用相同的转换表,将它变成一个 shell 过滤器是微不足道的,如下所示:
#!/usr/bin/env python
import elinks
import sys
for line in sys.stdin:
line = line.decode('utf-8')
sys.stdout.write(line.encode('ASCII', 'elinks'))
关于bash - 从命令行将文本转换为 7 位 ASCII,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/212745/