python - 如何将泰米尔语unicode值数组转换为带有空格的python中的泰米尔语字符串?

标签 python unicode tamil python-unicode indic

这是泰米尔语 unicode 代码点列表

[u'\u0b9a', u'\u0b9f', u'\u0bcd', u'\u0b9f', u'\u0b9a', u'\u0baa', u'\u0bc8', u'\u0baf ', u'\u0bbf', u'\u0bb2', u'\u0bcd', u'\u0ba8', u'\u0bc7', u'\u0bb1', u'\u0bcd', u'\u0bb1',你'\u0bc1]

如何将其转换为可读字符串?

最佳答案

无需转换。

    >>> alist = [
            u'\u0b9a', u'\u0b9f', u'\u0bcd', u'\u0b9f', u'\u0b9a',
            u'\u0baa', u'\u0bc8', u'\u0baf', u'\u0bbf', u'\u0bb2',
            u'\u0bcd', u'\u0ba8', u'\u0bc7', u'\u0bb1', u'\u0bcd',
            u'\u0bb1', u'\u0bc1',
            ]
    >>> print u''.join(alist)
    சட்டசபையில்நேற்று
    >>> 

更新:也许你想要这个:

>>> print u' '.join(alist)
ச ட ் ட ச ப ை ய ி ல ் ந ே ற ் ற ு

或者这个:

>>> import unicodedata
>>> for c in alist:
    print repr(c), c, unicodedata.category(c)


u'\u0b9a' ச Lo
u'\u0b9f' ட Lo
u'\u0bcd' ் Mn
u'\u0b9f' ட Lo
u'\u0b9a' ச Lo
u'\u0baa' ப Lo
u'\u0bc8' ை Mc
u'\u0baf' ய Lo
u'\u0bbf' ி Mc
u'\u0bb2' ல Lo
u'\u0bcd' ் Mn
u'\u0ba8' ந Lo
u'\u0bc7' ே Mc
u'\u0bb1' ற Lo
u'\u0bcd' ் Mn
u'\u0bb1' ற Lo
u'\u0bc1' ு Mc
>>> 

关于python - 如何将泰米尔语unicode值数组转换为带有空格的python中的泰米尔语字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9747605/

相关文章:

python - django admin 中用户定义的文本字段

excel - 如果您在 Windows 资源管理器中右键单击并使用 Excel 打开,如何在 Excel 中打开 txt 文件?

android - 在 Android 模拟器中安装新字体

python - 主要功能,pythonic?

python - 深入检查两个 python 词典并获得报告形式的差异

c++ - RegQueryValueEx 给出奇怪的数据

python - 识别字符是python中单词中的数字还是Unicode字符

jsp - 使用JSTL fmt库和属性文件时,泰米尔字符显示为问号

python - 有没有办法获取可执行二进制文件(.exe)并以某种方式获取 "compile".wasm

python - Django 的 JSON 和 XML fixtures 导致 UnicodeEncodeError