python - 如何在python的scrapy中删除字符串的特定部分

标签 python string web-scraping scrapy

我正在尝试获得干净的输出，因为当我抓取它提供的网站时，已于 2015 年 7 月 20 日进行了审核，因此我试图将其删除，因此它只显示 2015 年 7 月 20 日。这就是我一直在尝试的，当我自己测试它并制作一个模拟字典并用值填充它时，该代码可以工作，但不能在 scrapy 中。我假设 Field() 只是 dict = {value:[],value2:[]} 所以我不知道为什么它在 Field() 上不起作用

这是代码片段

for j in range(len(item['date'])):
    item['date'][j][9:].strip()

最佳答案

我会使用内置的re()选择器的方法:

response.xpath("//div[@id='test']/text()").re(r"\d{1,2}/\d{1,2}/\d{4}")

关于python - 如何在python的scrapy中删除字符串的特定部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31530800/

上一篇：python - HTML 抓取 - 如何在 yelp 业务页面中查找业务类别？

下一篇：python - 通过字典将函数传递给 thread.start_new_thread

python - 按字符串格式删除 Pandas Dataframe 中的某些行

python - 如何使用Python在Indesign中调整PDF文件的所有页面？

Java 替换不成对的双引号

java - 当值为日期时，如何使用 Java 在 JSON 字符串中添加引号

R:2019 年更改后的网页抓取 yahoo.finance

python - 如何使用 Selenium 将 nba.stats.com 上的页面从 "1"更改为 "All"

python - 在 MySQL 中使用 SP 更新/标记重复条目

python - 帮助处理 Python 字符串

javascript - 如何使用 cheerio 获取具有不同类的元素？