给定一个 unicode 字符,返回其 script 的最简单方法是什么? (如“拉丁语”、“韩语”等)? unicodedata似乎没有提供这种功能。
最佳答案
我希望有人以前做过,但显然没有,所以这就是我最终的结果。下面的模块(我称之为 unicodedata2
)扩展了 unicodedata
并提供了 script_cat(chr)
,它返回一个元组(脚本名称,类别) Unicode 字符。示例:
# coding=utf8
import unicodedata2
print unicodedata2.script_cat(u'Ф') #('Cyrillic', 'L')
print unicodedata2.script_cat(u'の') #('Hiragana', 'Lo')
print unicodedata2.script_cat(u'★') #('Common', 'So')
关于python - 找出一个字符的unicode脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9868792/