我有一个像“Previously”这样的文本,它看起来是英文,但里面有一个非 ASCII 字符:
将其转换为英文文本的最简单方法是什么(例如,“P”将是拉丁文大写字母 P)?
为简单起见,我们假设非英语字符是俄语。 但是,我们将不胜感激更通用的解决方案!
首选语言:Javascript、Ruby、Bash 脚本。
最佳答案
虽然一些西里尔(和希腊)字母在图形外观上与一些拉丁字母相同(即,包含这两种字母的任何字体可能没有区别),但它们之间没有定义正式的映射。因此,您需要自己定义映射。对于俄语,此类字母的数量相当有限,因此这将是一个小型映射表的问题。但是如果你想涵盖所有的 Unicode,有大量相似和几乎相似的字符,所以困难的部分是确定哪些字符足够相似。
关于javascript - 如何将看起来像英文的 Unicode 文本转换为 ASCII?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8874013/