python - 将大文件上传并运行一次到 file1.py 并在 file2.py 中运行多次

标签 python bigdata rdflib

我想将一个大文件加载到 python 脚本一次(这需要时间),但我想避免在多次运行该脚本时多次加载该文件。

例如,我有 file1.py 正在加载大文件,然后在 file2.py 中导入该大文件。我想在多次运行 file2.py 的同时将大文件加载到 file1.py 中。

谢谢!

最佳答案

您只需将两个脚本的功能组合到第三个脚本中即可。

示例file3.py

from file1 import upload, load_file, process_data #just an example
from file2 import process_more_data

if not exist(big_file): #implement a function that checks if the file has been uploaded already
    upload(big_file)
data = load_file(big_file)
a = process_data(data)
b = process_more_data(data)

阅读操作添加的代码作为注释,看来这两个脚本确实可以很容易地组合在一起:

以下代码可以放在同一个文件中。

import rdflib

rdffile3="C:/Users/aa/Desktop/YOLO/object-detection-opencv-master/yago_taxonomy-v1.1.ttl"
g3=rdflib.ConjunctiveGraph()
g4=g3.parse(rdffile3, format="turtle")

result = Mapping_function(g4)

关于python - 将大文件上传并运行一次到 file1.py 并在 file2.py 中运行多次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55705198/

相关文章:

hadoop - 在 Oozie 日志中获取 E0800

python - 在 ubuntu 12.04 上安装 RDFlib

python - RDFLib 空白节点打印

python - SPARQL:无法使用 FactForge 端点

python - 简单的python服务器 "connection refused"错误

python tidylib模块错误

hadoop - 如果具有相同的值,则停止 Hbase 更新操作

python - 导入错误 : No module named http django

python - 如何从 numpy 子数组中删除 NaN

从大表中选择数据时,MySQL nodejs 崩溃