python - MapReduce 批量更新数据存储

标签 python google-app-engine mapreduce

我需要使用 Python 批量更新包含 CSV 文件(250,000 行)的数据存储。通过对这个领域的研究,我发现 MapReduce 可以解决这个问题。

我发现了一些显示类似操作的示例,但似乎找不到如何使用此库对数据存储进行简单批量更新的示例。

您知道该领域的任何示例吗?或者您能否为我指出正确的方向?

谢谢

http://code.google.com/p/appengine-mapreduce/wiki/GettingStartedInPython

最佳答案

mapreduce可以产生mapreduce.operation.db.Put(entity)作为迭代器,应用程序引擎可以以非常有效的方式处理更新。或者您可以将 db.put(entities) 放入您的 mapreduce 方法中。在我看来,您正在从文件中读取数据并更新所有相关实体,mapreduce 可能不是最好的工具。

关于python - MapReduce 批量更新数据存储,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9216837/

相关文章:

python - Django / python : raw sql with multiple tables

python - 获取昨天的日期和时区

python - 使用 .Replace 时创建新行

java - mvn appengine :update and mvn appengine:deploy in Google App Engine 之间的区别

hadoop - 为什么 Hadoop yarn(2.7.1) 中的平均合并时间为零?以及如何获得这个时间的精确度

JavaScript Map/Reduce 返回按计数分组

python - 从 ANSI 转换为 UTF-8

google-app-engine - 如何使 golang gin 与谷歌应用程序引擎一起工作?

java - 阻止 servlet 访问 Jetty 中的文件系统或其他 Java 核心库(如 Google App Engine)?

c# - C# 中的 Hadoop - 响应状态代码不表示成功 : 500 (Server Error)