已解决
我解决了这个问题,谢谢大家的宝贵时间。
首先,这些是要求:
- 比较必须在变量内。 (比较2个变量是否包含unicode)
- Python 的版本必须是 2.x ,我知道版本 3 已经解决了这个问题,但不幸的是它不适用于我。
你好,我有一个用 python 编码的机器人,我想让它比较 2 个非英语字母 (unicode)。
我遇到的问题是,字母必须在变量内,所以我不能使用:
u'letter'
我想要比较的两个字母必须都在变量内。
我已经尝试过:
letter1 == letter2
它显示此错误: E:\bots\KiDo\KiDo.py:23: UnicodeWarning: Unicode 相等比较无法将两个参数转换为 Unicode - 将它们解释为不相等 导入系统
即使两个字母相同,也始终返回 False。 所以我想这意味着我正在比较 2 个 unicode 字母。
并尝试过:
letter = unicode(letter)
但它显示此错误:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd9 in position 0: ordinal not in range(128)
我在 Google 上进行了搜索,但我所能找到的只是使用 u' ',但这不适用于变量。
谢谢。
比较代码:
word1 = parameters.split()[0]
word2 = parameters.split()[1]
word3 = parameters.split()[2]
word4 = parameters.split()[3]
word5 = parameters.split()[4]
if word1[0] == letter:
if word2[0] == letter:
if word3[0] == letter:
if word4[0] == letter:
if word5[0] == letter:
reply(type, source,u'True')
最佳答案
看,字母 ç(不以 ASCII 表示的字符)可以表示为 str 对象或 unicode 对象(也许您对 unicode 的含义有点困惑)。
此外,如果您尝试创建 ASCII 表中不存在的 unicode 对象,则必须传递另一个编码表:
unicode('ç')
这将引发 UnicodeDecodeError,因为“ç”不是 ASCII 格式,而是
unicode('ç', encoding='utf-8')
可以使用,因为“ç”以 UTF-8 编码表形式呈现(可能与您的阿拉伯字母相同)。
您可以将 unicode 对象与 unicode 对象进行比较,就像将 str 对象与 str 对象进行比较一样,并且所有这些都必须正常工作。
此外,您可以将 str 对象与 unicode 对象进行比较,但如果您比较的不是 ASCII 字符,则很容易出错:“ç”作为 str 是“\xc3\xa7”,但作为 unicode 则只是“\xe7” (在比较中返回 False)。
所以@Karsa 可能真的是对的。问题在于你的“变量”(在Python中,更好的词是对象)。您必须证明您只是比较 str 或只是 unicode 对象。
所以,更好的代码可能是:
#-*- coding: utf-8 -*-
def compare_first_letter(phrase, compare_letter):
# making all unicode objects, with utf-8 codec
compare_letter = unicode(compare_letter,encoding='utf-8')
phrase = unicode(phrase,encoding='utf-8')
# taking the first letters of each word in phrase
first_letters = [word[0] for word in phrase.split()]
# comparing the first letters with the letter you want
for letter in first_letters:
if letter != compare_letter:
return False
return True # or your reply function
letter = 'ç'
phrase_1 = "one two three four"
phrase_2 = "çarinha çapoca çamuca"
print(compare_first_letter(phrase_1,letter))
print(compare_first_letter(phrase_2,letter))
关于Python:如何将unicode与变量内的unicode进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25838743/