我想从对日语文本进行 OCR 识别后收到的字符串中转换数字。
例如,当我提取日期时:
③① 年 ⑫ 月 ①③ 日
我想将其转换为:
31 年 12 月 13 日
实现它的最佳方法是什么?
最佳答案
我会用 unicodedata
import unicodedata
print(unicodedata.normalize("NFKC","③① 年 ⑫ 月 ①③ 日"))
结果是这样的
31 年 12 月 13 日
这也转换了日语数字的其他变体,全角数字。
import unicodedata
print(unicodedata.normalize("NFKC","123①②③123"))
到
123123123
关于text - 如何将带圆圈的数字转换为数字? (① 到 1),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54798701/