我需要使用 Python 批量更新包含 CSV 文件(250,000 行)的数据存储。通过对这个领域的研究,我发现 MapReduce 可以解决这个问题。
我发现了一些显示类似操作的示例,但似乎找不到如何使用此库对数据存储进行简单批量更新的示例。
您知道该领域的任何示例吗?或者您能否为我指出正确的方向?
谢谢
http://code.google.com/p/appengine-mapreduce/wiki/GettingStartedInPython
最佳答案
mapreduce可以产生mapreduce.operation.db.Put(entity)作为迭代器,应用程序引擎可以以非常有效的方式处理更新。或者您可以将 db.put(entities) 放入您的 mapreduce 方法中。在我看来,您正在从文件中读取数据并更新所有相关实体,mapreduce 可能不是最好的工具。
关于python - MapReduce 批量更新数据存储,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9216837/