python - 覆盖python中的内置类型__str__方法

我需要将一些代码从 Python2 移植到 Python3，主要问题似乎是字节类型，因为 str(bytes) 给我 b'%s' 结果，但是 '需要 %s'，所以我决定重写字节类的 __str__() 方法来打印我想要的内容。

我试图用从字节继承的类修补 builtins.bytes，但这似乎只适用于一个文件而不适用于整个项目，也不影响字节文字( b'').

如果有任何其他方法(不那么痛苦)从 py2 移植到 py3，很高兴看到它们。

使用 .decode('UTF-8') 是 Not Acceptable ，因为项目超过 4k 行并且在所有必要的地方添加 decode 方法会导致 progressive bugs 计数，并且还有一些这些 .decode 位置在第 3 方库中。

我试着做这样的事情:

import builtins

class StrBytes(builtins.bytes):
    def __str__(self):
        return self.decode('UTF-8')

builtins.bytes = StrBytes

然后，如果我使用 bytes()，它会创建 StrBytes 对象，而 str(bytes()) 正是我想要的。这种方式不好，因为它不包括从字节文字构造字节对象:

>>> type(bytes())
    <class 'StrBytes'>

>>> type(b'')
    <class 'bytes'>

而且我不确定它是否适用于整个项目，而不仅仅是一个文件。

在我的代码的许多不同地方，我有这样的东西:

return b''.join(some_extra_values)

keys = [b'1', b'2', b'3'] # actually keys are given from another part of code
for key in keys:
    some_dict[key] = some_value

some_dict['1'] # works in py2, not in py3, KeyError

最佳答案

文本的规则是“输入解码，输出编码”。尽管已经做了很多工作来使编写 v2 和 v3 之间兼容的代码变得更容易，但总会存在一些差异，而且 Python 3 不再定义 unicode 符号就是其中之一。

尝试修补 Python 中的内置类型并不是一个好主意。因为它们是在 C 中定义的，所以没有有效的方法来修补它们的方法。

一个可能有用的工具是

from __future__ import unicode_literals

当插入到程序开头时，会将所有字符串文字解释为 Unicode 字符串而不是字节串。

另一种调整代码的方法是利用 Python 3 未实现 unicode 名称这一事实来驱动特征检测。所以你可能会写，例如

try:
    unicode = unicode # RHS raises NameError on Python 3
except NameError:
    unicode = str

然后你可以通过书写来检查文本类型

if type(s) is unicode: 
    ...

并且比较应该适用于 v2 和 v3。

如果您在输入上正确解码，则不必插入许多解码调用，并且只需要在必须将字符串传递给某种外部工具时才需要编码。

关于python - 覆盖python中的内置类型__str__方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39574286/

python - 覆盖python中的内置类型str方法

上一篇：python - 列表索引必须是整数，而不是 str

下一篇：python - S4 对象中的属性装饰器 (R)