python - 如何在python的scrapy中删除字符串的特定部分

标签 python string web-scraping scrapy

我正在尝试获得干净的输出,因为当我抓取它提供的网站时,已于 2015 年 7 月 20 日进行了审核,因此我试图将其删除,因此它只显示 2015 年 7 月 20 日。这就是我一直在尝试的,当我自己测试它并制作一个模拟字典并用值填充它时,该代码可以工作,但不能在 scrapy 中。我假设 Field() 只是 dict = {value:[],value2:[]} 所以我不知道为什么它在 Field() 上不起作用

这是代码片段

for j in range(len(item['date'])):
    item['date'][j][9:].strip()

最佳答案

我会使用内置的re()选择器的方法:

response.xpath("//div[@id='test']/text()").re(r"\d{1,2}/\d{1,2}/\d{4}")

关于python - 如何在python的scrapy中删除字符串的特定部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31530800/

相关文章:

python - 从 django 子进程调用 python,找不到 mysql 错误

python - 按字符串格式删除 Pandas Dataframe 中的某些行

python - 如何使用Python在Indesign中调整PDF文件的所有页面?

Java 替换不成对的双引号

java - 当值为日期时,如何使用 Java 在 JSON 字符串中添加引号

R:2019 年更改后的网页抓取 yahoo.finance

python - 如何使用 Selenium 将 nba.stats.com 上的页面从 "1"更改为 "All"

python - 在 MySQL 中使用 SP 更新/标记重复条目

python - 帮助处理 Python 字符串

javascript - 如何使用 cheerio 获取具有不同类的元素?