html - 使用 XPath 从 HTML 中提取信息

标签 html xpath

我有一段 html,它是从我正在处理的网页的源代码中提取的:

<span itemprop="homeLocation" itemscope itemtype="http://schema.org/Place"><meta itemprop="name" content="Kansas"/>

...我想使用 Xpath 从中提取位置 Kansas

使用 Xpath checker ,我一直在测试这个但无济于事。

我试过了

//*[@itemprop="homeLocation"]/meta[@itemprop="name"]/@content

和类似的尝试,但似乎无法匹配。我不明白我做错了什么。

如有任何建议,我们将不胜感激。

最佳答案

您的 xPath 绝对有效。 问题出在 xml 上。

  1. 关闭 span 标签。
  2. itemscope 属性设置一些值。

也是最重要的。您尝试使用的 xPath 检查器似乎有一些错误。检查这个:http://www.freeformatter.com/xpath-tester.html#ad-output

我用过的Xml:

    <span 
      itemprop="homeLocation"
      itemscope=""
      itemtype="http://schema.org/Place">
             <meta itemprop="name" content="Kansas"/>
  </span>

结果:

Attribute='content="Kansas"'

关于html - 使用 XPath 从 HTML 中提取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33589020/

相关文章:

java - Jmeter 中的 XML 路径断言

html - 使用 css 逻辑解释从 div 创建三 Angular 形?

javascript - 通过javascript获取浏览器的尺寸

javascript - 更改 asp :TextBox css class depending on value using javascript

jquery - 如何更改jquery上下文菜单的样式

php - 如何为 XPath 查询选择多个属性

xml - 删除 XSLT 中的空属性

python - 如何获取 python selenium 中的所有数据?

html - 为什么颜色不会变回黑色?

xpath - xpath:查找其内容具有提供的字符串的节点