python - Python 中卡纳达语的 Unicode

标签 python unicode character-encoding

我正在尝试使用卡纳达语的 Unicode,当输入以下代码时,我正在使用 Python 2.7:

print u'\u0cb5\u0ccd\u0c87'

输出是ವ್ಇ,但我希望用卡纳达语打印“vi”??

最佳答案

我相信您没有正确编码字符串。我希望这就是您想要的:

>>> print u'\u0cb5\u0CBF'
ವಿ

您所做的是输出(使用 Unicode 分配给这些字符的全名):

  • 卡纳达语字母 VA
  • 卡纳达语标志 VIRAMA
  • 卡纳达语字母 I

我可以看到其中的逻辑,但这不是 Unicode 的工作原理。 virama 应该仅用于辅音簇或者如果您有一个以辅音结尾的序列。要将音节与元音组合起来,您必须将音节与元音的组合形式一起使用:

  • 卡纳达语字母 VA
  • 卡纳达语元音符号 I

卡纳达语元音符号 I 是字母“I”的组合形式,而卡纳达语字母 I 是同一字母的非组合形式。

我建议阅读chapter 9 of the Unicode standard有关如何处理南亚文字的完整说明。 Chapter 10也很有用。

关于python - Python 中卡纳达语的 Unicode,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20701879/

相关文章:

Python 不能正确解释 UTF8

python - 使用 sqlalchemy 和 mysql 插入 unicode 消息

Python Unicode 打印错误

python - 在用户登录之前阻止侧栏上的按钮?

python - 将 pandas 数据框中的列值乘以列标题

python - 检查 asyncio.get_event_loop() 是否已完成?

python - 创建 Pycharm 后更改项目解释器

python - 用python将unicode数据写入mssql?

java - 附加到 JTextArea 不会在 '\n' 上创建换行符

c# - 如何在 .net 中生成 UTF-8 字符集中的所有字符