我正在尝试获得干净的输出,因为当我抓取它提供的网站时,已于 2015 年 7 月 20 日进行了审核,因此我试图将其删除,因此它只显示 2015 年 7 月 20 日。这就是我一直在尝试的,当我自己测试它并制作一个模拟字典并用值填充它时,该代码可以工作,但不能在 scrapy 中。我假设 Field()
只是 dict = {value:[],value2:[]}
所以我不知道为什么它在 Field() 上不起作用
这是代码片段
for j in range(len(item['date'])):
item['date'][j][9:].strip()
最佳答案
我会使用内置的re()
选择器的方法:
response.xpath("//div[@id='test']/text()").re(r"\d{1,2}/\d{1,2}/\d{4}")
关于python - 如何在python的scrapy中删除字符串的特定部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31530800/