我需要将一些代码从 Python2 移植到 Python3,主要问题似乎是字节类型,因为 str(bytes) 给我 b'%s'
结果,但是 '需要 %s'
,所以我决定重写字节类的 __str__()
方法来打印我想要的内容。
我试图用从字节继承的类修补 builtins.bytes
,但这似乎只适用于一个文件而不适用于整个项目,也不影响字节文字( b''
).
如果有任何其他方法(不那么痛苦)从 py2 移植到 py3,很高兴看到它们。
使用 .decode('UTF-8')
是 Not Acceptable ,因为项目超过 4k 行并且在所有必要的地方添加 decode 方法会导致 progressive bugs 计数,并且还有一些这些 .decode
位置在第 3 方库中。
我试着做这样的事情:
import builtins
class StrBytes(builtins.bytes):
def __str__(self):
return self.decode('UTF-8')
builtins.bytes = StrBytes
然后,如果我使用 bytes()
,它会创建 StrBytes
对象,而 str(bytes())
正是我想要的。这种方式不好,因为它不包括从字节文字构造字节对象:
>>> type(bytes())
<class 'StrBytes'>
>>> type(b'')
<class 'bytes'>
而且我不确定它是否适用于整个项目,而不仅仅是一个文件。
在我的代码的许多不同地方,我有这样的东西:
return b''.join(some_extra_values)
keys = [b'1', b'2', b'3'] # actually keys are given from another part of code
for key in keys:
some_dict[key] = some_value
some_dict['1'] # works in py2, not in py3, KeyError
最佳答案
文本的规则是“输入解码,输出编码”。尽管已经做了很多工作来使编写 v2 和 v3 之间兼容的代码变得更容易,但总会存在一些差异,而且 Python 3 不再定义 unicode
符号就是其中之一。
尝试修补 Python 中的内置类型并不是一个好主意。因为它们是在 C 中定义的,所以没有有效的方法来修补它们的方法。
一个可能有用的工具是
from __future__ import unicode_literals
当插入到程序开头时,会将所有字符串文字解释为 Unicode 字符串而不是字节串。
另一种调整代码的方法是利用 Python 3 未实现 unicode
名称这一事实来驱动特征检测。所以你可能会写,例如
try:
unicode = unicode # RHS raises NameError on Python 3
except NameError:
unicode = str
然后你可以通过书写来检查文本类型
if type(s) is unicode:
...
并且比较应该适用于 v2 和 v3。
如果您在输入上正确解码,则不必插入许多解码调用,并且只需要在必须将字符串传递给某种外部工具时才需要编码。
关于python - 覆盖python中的内置类型__str__方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39574286/