在尝试resolve my problem时(按特定项目的字段输出有序 Json 数组),我已经 received an answer这建议我为这项工作创建一个自定义导出器。
我正在创建一个,但是...我发现的所有示例都建议通过管道调用它,但这对我来说似乎有点多余(我已经在个人导出器上定义了自定义行为...为什么我也应该使用管道进行自定义?)。
我搜索的是一种通过 scrapy shell 定义后调用自定义导出器的方法。例如,要输出 json,我将使用:
scrapy crawl myspider -o myjson.json
是否存在某种方式来指定我的自定义导出器以类似的方式写入文件?我发现了一个实验性功能 COMMANDS_MODULE对于自定义命令,但我不确定如何将其链接到我的自定义导出器。
最佳答案
您可以使用 FEED_EXPORTERS 激活导出器设置。
FEED_EXPORTERS = {
'json': 'path.to.SortedJsonItemExporter',
}
关于python - 通过命令行调用scrapy的自定义导出器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48929331/