Python:如何将unicode与变量内的unicode进行比较

标签 python unicode comparison

已解决

我解决了这个问题,谢谢大家的宝贵时间。

首先,这些是要求:

  1. 比较必须在变量内。 (比较2个变量是否包含unicode)
  2. Python 的版本必须是 2.x ,我知道版本 3 已经解决了这个问题,但不幸的是它不适用于我。

你好,我有一个用 python 编码的机器人,我想让它比较 2 个非英语字母 (unicode)。

我遇到的问题是,字母必须在变量内,所以我不能使用:

u'letter'

我想要比较的两个字母必须都在变量内。

我已经尝试过:

letter1 == letter2

它显示此错误: E:\bots\KiDo\KiDo.py:23: UnicodeWarning: Unicode 相等比较无法将两个参数转换为 Unicode - 将它们解释为不相等 导入系统

即使两个字母相同,也始终返回 False。 所以我想这意味着我正在比较 2 个 unicode 字母。

并尝试过:

letter = unicode(letter)

但它显示此错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xd9 in position 0: ordinal not in range(128)

我在 Google 上进行了搜索,但我所能找到的只是使用 u' ',但这不适用于变量。

谢谢。

比较代码:

word1 = parameters.split()[0]
word2 = parameters.split()[1]
word3 = parameters.split()[2]
word4 = parameters.split()[3]
word5 = parameters.split()[4]
if word1[0] == letter:
    if word2[0] == letter:
        if word3[0] == letter:
            if word4[0] == letter:
                if word5[0] == letter:
                    reply(type, source,u'True')

最佳答案

看,字母 ç(不以 ASCII 表示的字符)可以表示为 str 对象或 unicode 对象(也许您对 unicode 的含义有点困惑)。

此外,如果您尝试创建 ASCII 表中不存在的 unicode 对象,则必须传递另一个编码表:

unicode('ç')

这将引发 UnicodeDecodeError,因为“ç”不是 ASCII 格式,而是

unicode('ç', encoding='utf-8')

可以使用,因为“ç”以 UTF-8 编码表形式呈现(可能与您的阿拉伯字母相同)。

您可以将 unicode 对象与 unicode 对象进行比较,就像将 str 对象与 str 对象进行比较一样,并且所有这些都必须正常工作。

此外,您可以将 str 对象与 unicode 对象进行比较,但如果您比较的不是 ASCII 字符,则很容易出错:“ç”作为 str 是“\xc3\xa7”,但作为 unicode 则只是“\xe7” (在比较中返回 False)。

所以@Karsa 可能真的是对的。问题在于你的“变量”(在Python中,更好的词是对象)。您必须证明您只是比较 str 或只是 unicode 对象。

所以,更好的代码可能是:

#-*- coding: utf-8 -*-

def compare_first_letter(phrase, compare_letter):
    # making all unicode objects, with utf-8 codec
    compare_letter = unicode(compare_letter,encoding='utf-8')
    phrase = unicode(phrase,encoding='utf-8')
    # taking the first letters of each word in phrase
    first_letters = [word[0] for word in phrase.split()]
    # comparing the  first letters with the letter you want
    for letter in first_letters:
        if letter != compare_letter:
            return False
    return True # or your reply function

letter = 'ç'
phrase_1 = "one two three four"
phrase_2 = "çarinha çapoca çamuca"

print(compare_first_letter(phrase_1,letter))
print(compare_first_letter(phrase_2,letter))

关于Python:如何将unicode与变量内的unicode进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25838743/

相关文章:

python - pyspark使用lambda内的正则表达式分割字符串

python - 将参数传递给函数以进行拟合

java - MySQL以库尔德字体存储数据?

c++ - UTF8 与宽字符?

python - 通过 python 发送命令时出现类型错误

python - 如何一次比较四列 Pandas 数据框?

python 列替换和 fillnna

perl - 使用直方图来确定有色物体的存在?

c# - 64 位整数上的 C++ 与 C# 按位运算 - 性能

C 字符串比较 - 等于 true