python - 导出应用程序引擎数据时如何排除列

标签 python django google-app-engine csv

我计划在我的 django 应用程序上进行一些数据挖掘,该应用程序使用 appengine 来存储数据,但是,我的一个表将图像存储在其中的两列中,因此,它的大小为千兆字节,所以它很远每次我想分析新数据时下载速度太慢。对于数据挖掘,我只关心该表中的计划文本列,如何在将数据导出到 csv 文件时排除这些列?

我知道 buildupload.yaml 的 csv 连接器有一个“column_list”,您可以指定它在导出数据时仅包含某些列,但看起来它仍然会在过滤掉整个表行之前下载整个表行将 appengine 的中间 sqlite3 数据文件转换为 csv 时的列。

仅供引用,我正在使用此处描述的方法下载我的数据 http://code.google.com/appengine/docs/python/tools/uploadingdata.html ,但我愿意接受其他解决方案,最好是可以每隔几天自动导出一次数据的解决方案。

最佳答案

你不能。 AppEngine 数据存储区 API 和底层 GQL 仅执行两种 SELECT 查询:仅 __key__ 和所有字段。无法获取字段的子集。

关于python - 导出应用程序引擎数据时如何排除列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5631956/

相关文章:

python - 如何在其他列满足特定条件的情况下替换 NaN 值?

python - Plotly 中条形图的单独标记条

python - 我可以使用变量的值作为函数的参数名称吗?

python - Django:模板中 if 条件的问题

google-app-engine - Google Cloud Appengine Flex websocket 支持

python utc 时间减去 5 分钟

python - 如何将 Django 设置导入 python 独立脚本

python - Django:自定义ManyToManyField表单选项

python - Vagrant 和 Google App Engine 不同步文件

java - 如何使用java从appengine数据存储中获取更新的对象集合?