google-chrome - 如何从Chrome检查器获取原始XPath?

标签 google-chrome xpath screen-scraping

当我使用Google Chrome浏览器的超酷元素检查器查找元素的XPath时,它将返回原始HTML中不存在的内容,例如<tbody>

显然,Chrome推断出某些因素可以使页面呈现更加流畅;没关系。但是我需要将XPath用于Chrome之外的脚本。因此,我通常会得到Chrome的XPath,然后使用反复试验,直到XPath在其他上下文中实际可用(在我的情况下,是用Python或Node.js编写的脚本)。

在给定网页中查找HTML元素的“原始” XPath的更好技术是什么?

最佳答案

不要使用完整的xpath。如果这样做,则只要移动单个元素,脚本就会中断。最好找到最简单的表达式,以提供您所追求的目标。例如,此页面的标题可能是://h1[@itemprop="name"]甚至只是//h1。如果您的HTML解析器让您使用CSS选择器,甚至更好-尝试使用这些选择器。

关于google-chrome - 如何从Chrome检查器获取原始XPath?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15171537/

相关文章:

android - 科莫多 SSL : ERR_CERT_AUTHORITY_INVALID on Chrome mobile and Opera mobile (Android)

python 的 scrapy 似乎没有从所有可用的 URL 中获取数据

python - 如何使用 Scrapy 选择器处理不一致的标记?

ssl - 从 ssl 站点抓取表单并自己使用

javascript - Chrome 和 Firefox 之间的时间戳转换差异

Javascript 同源策略和 Google Chrome 控制台

javascript - 如何停止页面上的脚本执行?

xml - 未指定子级的XPath选择节点

python-2.7 - 使用 scrapy 递归地抓取 phpBB 论坛