python - Scrapy Xpath : Extracting @title from img node

标签 python scrapy scrapy-shell

我想从本页的主要注释部分中提取@title:https://www.fragrantica.com/perfume/Remy-Latour/Cigar-9351.html

我已经获取了 HTML，然后在 scrapy shell 上尝试了这行代码，但输出为 None:

response.xpath('//*[@id="userMainNotes"]/div/img/@title).extract_first()

我做错了什么？

最佳答案

如果您检查源代码 ( Ctrl+U )，您会发现:

<div title="96:241;171:117;33:103;34:103;41:70;128:63;4:59;182:59;170:58;75:56;191:48;21:39;77:39;14:28" id="userMainNotes">Loading...</div>

这意味着上面的<div>是由 Javascript 渲染的，这就是你的代码不起作用的原因。

关于python - Scrapy Xpath : Extracting @title from img node，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52243212/

上一篇：python - 生成具有年增长率的 future 数据框

下一篇：python - django请求中写入id=-1是什么意思？

相关文章：

python - 将 JSON 数组嵌套到 Python Pandas DataFrame

Python sklearn.mixture.GMM 不适合扩展吗？

python - 如何让 Scrapy 只抓取一页(使其非递归)？

python - Scrapy - TypeError : Cannot convert unicode body - HtmlResponse has no encoding

python - Scrapy:为什么我不能从地下天气中提取我的目标数据？

python - 使用python操作excel 2007文件

python - 在 Django 中安装 MySQL 客户端显示错误

python - 使用多种配置启动 Scrapyd

web-scraping - Scrapy Shell 和 Scrapy Splash

python - 启动 scrapy shell 时如何禁用 robots.txt？

©2024 IT工具网联系我们