python - 覆盖python中的内置类型__str__方法

标签 python python-2.7 python-3.x decode built-in

我需要将一些代码从 Python2 移植到 Python3,主要问题似乎是字节类型,因为 str(bytes) 给我 b'%s' 结果,但是 '需要 %s',所以我决定重写字节类的 __str__() 方法来打印我想要的内容。

我试图用从字节继承的类修补 builtins.bytes,但这似乎只适用于一个文件而不适用于整个项目,也不影响字节文字( b'').

如果有任何其他方法(不那么痛苦)从 py2 移植到 py3,很高兴看到它们。

使用 .decode('UTF-8') 是 Not Acceptable ,因为项目超过 4k 行并且在所有必要的地方添加 decode 方法会导致 progressive bugs 计数,并且还有一些这些 .decode 位置在第 3 方库中。

我试着做这样的事情:

import builtins

class StrBytes(builtins.bytes):
    def __str__(self):
        return self.decode('UTF-8')

builtins.bytes = StrBytes

然后,如果我使用 bytes(),它会创建 StrBytes 对象,而 str(bytes()) 正是我想要的。这种方式不好,因为它不包括从字节文字构造字节对象:

>>> type(bytes())
    <class 'StrBytes'>

>>> type(b'')
    <class 'bytes'>

而且我不确定它是否适用于整个项目,而不仅仅是一个文件。

在我的代码的许多不同地方,我有这样的东西:

return b''.join(some_extra_values)

keys = [b'1', b'2', b'3'] # actually keys are given from another part of code
for key in keys:
    some_dict[key] = some_value

some_dict['1'] # works in py2, not in py3, KeyError

最佳答案

文本的规则是“输入解码,输出编码”。尽管已经做了很多工作来使编写 v2 和 v3 之间兼容的代码变得更容易,但总会存在一些差异,而且 Python 3 不再定义 unicode 符号就是其中之一。

尝试修补 Python 中的内置类型并不是一个好主意。因为它们是在 C 中定义的,所以没有有效的方法来修补它们的方法。

一个可能有用的工具是

from __future__ import unicode_literals

当插入到程序开头时,会将所有字符串文字解释为 Unicode 字符串而不是字节串。

另一种调整代码的方法是利用 Python 3 未实现 unicode 名称这一事实来驱动特征检测。所以你可能会写,例如

try:
    unicode = unicode # RHS raises NameError on Python 3
except NameError:
    unicode = str

然后你可以通过书写来检查文本类型

if type(s) is unicode: 
    ...

并且比较应该适用于 v2 和 v3。

如果您在输入上正确解码,则不必插入许多解码调用,并且只需要在必须将字符串传递给某种外部工具时才需要编码。

关于python - 覆盖python中的内置类型__str__方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39574286/

相关文章:

python - 展平 Pandas 数据框连接结果

python-3.x - Pydev,如何在异常时暂停

Python查找所有出现的连字符单词并替换该位置

python - 你能从 boto 得到 AWS 账户名吗?

c# - Python 的 xml.etree getiterator 相当于 C#

python - 从 numpy.datetime64 转换为 pandas.tslib.Timestamp 错误?

Python 无法识别 Django 安装。 (导入错误 : No module named django)

python - 使用正则表达式获取标签后的第二个 div

python - 使用字典列表更新 SQL 表

python - Pandas DataFrame,1、2、3 和 NaN 值的默认数据类型