python - 将 python 导入放入函数中是否会产生性能成本?

标签 python

我构建了相当复杂的 Python 应用程序,通常使用 Django。为了简化应用程序间接口(interface),我有时会使用从模型中抽象出来的 service.py 模块。

由于这些“聚合功能”,它们经常以循环导入结束,通过将导入语句放在服务函数中可以轻松消除这种导入。

通常将导入移动到尽可能靠近其使用点是否会产生显着的性能或内存成本?例如,如果我只在文件的一个函数中使用特定的导入名称,那么将导入放置在该特定函数中而不是文件顶部的常规位置似乎很自然。

此问题与 this question 略有不同因为每个导入都在函数命名空间中。

最佳答案

如果您担心的话,您导入模块的时间点预计不会导致性能下降。模块是单例的,不会是 import每次编辑一个import遇到语句。但是,您如何进行导入以及后续的属性查找确实会产生影响。

例如,如果您 import math然后每次你需要使用 sin(...)你必须做的功能math.sin(...) , 这通常比做 from math import sin 慢并使用 sin(...)直接因为系统不必一直在模块中查找函数名称。

此查找惩罚适用于使用点 . 访问的任何内容并且在循环中会特别引人注目。因此,建议获取对您可能需要在性能关键循环/部分中频繁使用/调用的内容的本地引用。

例如,使用原来的import math例如,就在关键循环之前,您可以执行以下操作:

# ... within some function
sin = math.sin
for i in range(0, REALLY_BIG_NUMBER):
    x = sin(i)   # faster than:  x = math.sin(x)
    # ...

这是一个简单的示例,但请注意,您可以对其他对象(例如列表、字典等)的方法执行类似的操作。

我可能更关心您提到的循环导入。如果您打算通过将导入语句移动到更多“本地”位置(例如在特定函数或代码块等内)来“修复”循环导入,您可能需要解决更深层次的问题。

就我个人而言,我会像往常一样将导入保留在模块的顶部。无缘无故地偏离该模式可能会使您的代码更难通过,因为您的模块的依赖关系不会立即显现出来(即 import 语句分散在整个代码中而不是在一个位置).

它也可能使循环依赖问题看起来更难调试,更容易陷入。毕竟,如果模块没有在上面列出,有人可能会高兴地认为您的模块 A不依赖于模块 B然后向上添加 import AB什么时候A已经有 import B隐藏在某个深暗的角落。


基准样本

这是一个使用查找符号的基准测试:

>>> timeit('for i in range(0, 10000): x = math.sin(i)', setup='import math', number=50000)
89.7203312900001

还有另一个基准测试使用查找符号:

>>> timeit('for i in range(0, 10000): x = sin(i)', setup='from math import sin', number=50000)
78.27029322999988

这里有 10+ 秒的差异。

请注意,您的 yield 取决于程序运行此代码所花费的时间——即性能关键部分而不是零星的函数调用。

关于python - 将 python 导入放入函数中是否会产生性能成本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32151193/

相关文章:

python - 在 Miniconda 上安装 Jupyter Notebook

Python 正则表达式匹配带或不带逗号或小数的货币

python - 如何在 Jinja2 的方法调用中引用对象属性?

python - 如果 Dataframe 中的行包含某些字符串删除

python - setup.py 中的 runall 命令

python - 多维数组的就地改组

python - 所有区域的 AWS Cloudformation 堆栈

python - 关于Python中的各种正则表达式和列表长度的条件语句

python - 如何使用 python Schedule 创建一个作业任务,仅在白天早上 6 点到晚上 10 点期间每 3 分钟运行一次

python - 如何修复 HTML 电子邮件编号列表导致列表后的选项卡超过 99?