web-scraping - 制表符分隔的 csv 而不是在 scrapy 中分隔的逗号

标签 web-scraping scrapy

我目前正在使用命令

scrapy crawl myspider -o output.csv -t csv

获取输出 csv 文件。默认情况下,这些文件以逗号分隔。我如何获取制表符分隔的文件?

最佳答案

使用此解决方案覆盖 Scrapy 的默认 CSV 编写器分隔符。

scraper/exporters.py

from scrapy.exporters import CsvItemExporter


class CsvCustomSeperator(CsvItemExporter):
    def __init__(self, *args, **kwargs):
        kwargs['encoding'] = 'utf-8'
        kwargs['delimiter'] = '\t'
        super(CsvCustomSeperator, self).__init__(*args, **kwargs)

scraper/settings.py

FEED_EXPORTERS = {
    'csv': 'scraper.exporters.CsvCustomSeperator'
}

在终端

$ scrapy crawl spider -o file.csv

关于web-scraping - 制表符分隔的 csv 而不是在 scrapy 中分隔的逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23113849/

相关文章:

css - Scrapy Selector CSS 不返回子节点

python - 如何通过循环将数组值按索引发送到另一个数组?

python - 无法使用 Scrapy dist-packages/cryptography/hazmat/bindings/_openssl.so 启动项目

r - 在 Rstudio 中使用 rvest 抓取时,我得到了与网络上不同的 html 文本

r - 从 <dl> 标签中抓取 HTML 文本

python - 使用 Beautifulsoup 进行数据抓取。找错 body

python - Scrapy-elasticsearch插件问题

python - 使用 Selenium 从 stackoverflow 中提取用户数据

python - 登录 Scrapy

python - scrapy错误处理url