当我使用Google Chrome浏览器的超酷元素检查器查找元素的XPath时,它将返回原始HTML中不存在的内容,例如<tbody>
。
显然,Chrome推断出某些因素可以使页面呈现更加流畅;没关系。但是我需要将XPath用于Chrome之外的脚本。因此,我通常会得到Chrome的XPath,然后使用反复试验,直到XPath在其他上下文中实际可用(在我的情况下,是用Python或Node.js编写的脚本)。
在给定网页中查找HTML元素的“原始” XPath的更好技术是什么?
最佳答案
不要使用完整的xpath。如果这样做,则只要移动单个元素,脚本就会中断。最好找到最简单的表达式,以提供您所追求的目标。例如,此页面的标题可能是://h1[@itemprop="name"]
甚至只是//h1
。如果您的HTML解析器让您使用CSS选择器,甚至更好-尝试使用这些选择器。
关于google-chrome - 如何从Chrome检查器获取原始XPath?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15171537/