google-chrome - 如何从Chrome检查器获取原始XPath？

标签 google-chrome xpath screen-scraping

当我使用Google Chrome浏览器的超酷元素检查器查找元素的XPath时，它将返回原始HTML中不存在的内容，例如<tbody>。

显然，Chrome推断出某些因素可以使页面呈现更加流畅；没关系。但是我需要将XPath用于Chrome之外的脚本。因此，我通常会得到Chrome的XPath，然后使用反复试验，直到XPath在其他上下文中实际可用（在我的情况下，是用Python或Node.js编写的脚本）。

在给定网页中查找HTML元素的“原始” XPath的更好技术是什么？

最佳答案

不要使用完整的xpath。如果这样做，则只要移动单个元素，脚本就会中断。最好找到最简单的表达式，以提供您所追求的目标。例如，此页面的标题可能是：//h1[@itemprop="name"]甚至只是//h1。如果您的HTML解析器让您使用CSS选择器，甚至更好-尝试使用这些选择器。

关于google-chrome - 如何从Chrome检查器获取原始XPath？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15171537/

上一篇：css - 为什么在使用concat()时此Selenium XPath表达式无法返回结果？

下一篇：regex - 如何使用XPath正则表达式匹配URL

python 的 scrapy 似乎没有从所有可用的 URL 中获取数据

python - 如何使用 Scrapy 选择器处理不一致的标记？

ssl - 从 ssl 站点抓取表单并自己使用

javascript - Chrome 和 Firefox 之间的时间戳转换差异

Javascript 同源策略和 Google Chrome 控制台

javascript - 如何停止页面上的脚本执行？

xml - 未指定子级的XPath选择节点

python-2.7 - 使用 scrapy 递归地抓取 phpBB 论坛