python - string.decode() 与 unicode(string)

标签 python string unicode decode

myString = 'éíěřáé'

我需要将这个字符串解码为 unicode。下面的用法和这两种方法之间一般有什么区别吗？

myString.decode(encoding='UTF-8', errors='ignore')

和

unicode(myString, encoding='UTF-8', errors='ignore')

最佳答案

unicode 构造函数可以接受除字符串之外的其他类型:

>>> unicode(10)
u'10'

然而，对于 bytestring 的情况，这两种形式在很大程度上是等价的。某些编码选项对 unicode 构造函数无效，因为它们不会导致 unicode 输出，但对字节串的 .decode 方法有效，例如 '十六进制':

>>> unicode('10', encoding='hex')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: decoder did not return an unicode object (type=str)

关于python - string.decode() 与 unicode(string)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11861551/

上一篇：python - 如何以 pythonic 方式填充 Pandas dataframe 缺失的记录？

下一篇：python - functools.partial 和类似的 lambda 之间的区别？

python - scipy.interpolate.interp1d 'kind' 不工作

c# - 将列表转换为小字符串

mysql - Unicode CSV 文件中未显示孟加拉语文本

java - 检查字符串是否可在 Gsm0338 中编码

python - 如果定义了数据列限制，则按默认值填充行

python - 如何在 django 中获取时区感知日期？

c - 如何将字符串分配给 C 中的字符指针？

java 。 string.replaceFirst() 的奇怪行为

python - 获取Unicode代码点对应的字符