python - 当 sys.path 不同时,dill python 模块是否处理导入模块?

标签 python dill pathos

我正在评估 dill,我想知道这种情况是否得到处理。我有一个案例,我在 python 进程中成功导入了一个模块。我可以使用 dill 序列化然后在具有不包含该模块的不同 sys.path 的不同进程中加载​​该模块吗?现在我遇到导入失败,但也许我做错了什么。

这是一个例子。我运行此脚本,其中 foo.py 模块的路径位于我的 sys.path 中:

% cat dill_dump.py 
import dill
import foo
myFile = "./foo.pkl"
fh = open(myFile, 'wb')
dill.dump(foo, fh)

现在,我在我的 PYTHONPATH 中没有 foo.py 目录的地方运行这个脚本:

% cat dill_load.py 
import dill
myFile = "./foo.pkl"
fh = open(myFile, 'rb')
foo = dill.load(fh)
print foo

此堆栈跟踪失败:

Traceback (most recent call last):
  File "dill_load.py", line 4, in <module>
    foo = dill.load(fh)
  File "/home/b/lib/python/dill-0.2.4-py2.6.egg/dill/dill.py", line 199, in load
    obj = pik.load()
  File "/rel/lang/python/2.6.4-8/lib/python2.6/pickle.py", line 858, in load
    dispatch[key](self)
  File "/rel/lang/python/2.6.4-8/lib/python2.6/pickle.py", line 1133, in load_reduce
    value = func(*args)
  File "/home/b/lib/python/dill-0.2.4-py2.6.egg/dill/dill.py", line 678, in _import_module
    return __import__(import_name)
ImportError: No module named foo

那么,如果我需要在两个进程之间使用相同的 python 路径,那么序列化 python 模块有什么意义呢?或者换句话说,通过 dill 加载 foo 是否比仅调用“import foo”有任何优势?

最佳答案

这是一个有趣的失败。请注意,如果您执行 dill.dumps(foo),您将获得模块 foo 的内容……失败的部分是使用 python 的内置导入 Hook (__import__) 只是将模块注册到 sys.modules 中。应该可以解决这个问题并修改 dill 以便在 PYTHONPATH 中找不到该模块时可以导入该模块。但是,我确实认为必须在 PYTHONPATH 中找到该模块是正确的……这是对模块的期望……所以我不确定这是否是个好主意。但它可能是...

如上所述,对于文件 foo.py,其内容为:hello = "hello world, I am foo"

>>> import dill
>>> import foo
>>> dill.dumps(foo)
'\x80\x02cdill.dill\n_import_module\nq\x00U\x03fooq\x01\x85q\x02Rq\x03}q\x04(U\x08__name__q\x05h\x01U\x08__file__q\x06U\x06foo.pyq\x07U\x05helloq\x08U\x15hello world, I am fooq\tU\x07__doc__q\nNU\x0b__package__q\x0bNub.'

你可以看到文件的内容被保存在 pickle 中。

dill 与模块一起使用的主要原因是 dill 可以记录对模块的动态修改。例如,添加一个函数或其他对象:

>>> import foo 
>>> import dill
>>> foo.a = 100
>>> with open('foo.pkl', 'w') as f:
...   dill.dump(foo, f)
... 
>>> 

然后重新启动...(在 PYTHONPATH 中使用 foo)

Python 2.7.10 (default, May 25 2015, 13:16:30) 
[GCC 4.2.1 Compatible Apple LLVM 5.1 (clang-503.0.40)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import dill
>>> with open('foo.pkl', 'r') as f:
...   foo = dill.load(f)
... 
>>> foo.hello
'hello world, I am foo'
>>> foo.a
100
>>> 

我已将其添加为错误报告/功能请求:https://github.com/uqfoundation/dill/issues/123

关于python - 当 sys.path 不同时,dill python 模块是否处理导入模块?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31884640/

相关文章:

python - 我可以更新 python 的 pycharm intellisense 吗?

python - 如何在 Python 代码继续运行时持续闪烁 LED(或其他 while 循环)

python - 如何在python中找到gdal中的波段数?

python - 无法将 map() 或 select(range()) 与 Huggingface 数据集库一起使用,导致 dill_.dill 没有属性日志

python - Windows操作系统中的pathos包

python:使变量等于运算符(+,/,*,-)

python - `pickle` : yet another `ImportError: No module named my_module`

python - pathos: parallel processing options - 有人能解释一下差异吗?

python 多处理悲情 - AuthenticationError : digest sent was rejected - Windows

Python 多处理 : AttributeError: 'Test' object has no attribute 'get_type'