shell - 如何使用 scrapy response.xpath 提取 HTML 属性的值?

标签 shell xpath scrapy

我正在尝试提取属性 data-asin-price 的值里面 <div>标签

在下面的示例中您可以看到22.63

<div id="cerberus-data-metrics" style="display: none;" data-asin="B079GMRZ8S" data-asin-price="22.63" data-asin-shipping="0.0" data-asin-currency-code="AUD" data-substitute-count="-1" data-device-type="WEB" data-display-code="Asin is not eligible because it is not enabled"></div>

有什么方法可以使用response.xpath()和scrapy来做到这一点吗?

谢谢

最佳答案

我只是想发布我找到的答案。

为了在 scrapy shell 中获取 data-asin-price 属性的 22.63 值,我执行了以下操作:

response.xpath('//div[@id = "cerberus-data-metrics"]/@data-asin-price').extract_first()

干杯

关于shell - 如何使用 scrapy response.xpath 提取 HTML 属性的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53218461/

相关文章:

bash - 如何在 bash 中循环移动字符串?

shell - 输出tar归档中的根目录

linux - Sudo 将中断导入我的脚本

java - Citrus XPath 验证找不到元素

linux - ". ./filename "命令是如何工作的

xml - 如何在 XSLT 中获取以下同级

python - 使用 Python 规范化空格

python - 在 Celery 任务中运行 Scrapy 蜘蛛

python - 使用 Scrapy 进行 NTLM 身份验证以进行网络抓取

python - Scrapy 性能改进和内存消耗