html - 如何返回 XPath 表达式的单个字符串值？

这是我的 HTML:

<?xml version="1.0" encoding="UTF-8"?>

<div class="single-main"> 
  <h3 class="description-area">Description</h3>  
  <p>bla bla bla
    <br/> some text 
    <br/> some text here ,
    <br/> other text here
  </p> 
</div>

我想获取整个文本，但在一个 XPath 表达式中。

这是我的代码:

response.xpath(".//h3[@class='description-area']/following-sibling::p
                //text()[count(preceding-sibling::br) >= 0]").extract()[0]

但它只返回第一个 br 之前的文本(我知道为什么，那是因为我正在使用 .extract()[0] 并且如果我使用 . extract()[1] 和 [2] ....我会得到我想要的，但我必须使用 .extract[0] 因为它是一个可以做到这一点的平台。有没有XPath 返回整个文本但在一个字符串中而不是在多个字符串中？

最佳答案

string(/) 将返回整个文档的字符串值。

更新:要返回此 XPath 返回的四个单独的字符串，

.//h3[@class='description-area']/following-sibling::p//text()[count(preceding-sibling::br) >= 0]

作为单个字符串，将上述 XPath 类似地包装在 string() 中:

string(.//h3[@class='description-area']/following-sibling::p//text()[count(preceding-sibling::br) >= 0])

更新 2:但是 br 和 text() 操作不是必需的。您可以简单地获取 p 的字符串值:

string(.//h3[@class='description-area']/following-sibling::p)

关于html - 如何返回 XPath 表达式的单个字符串值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37015039/

上一篇：c# - 创建文件并在那里写入 xml (C#)

下一篇：xml - 无法确定用于不包含 ID 的嵌套 SVG 元素的 XPATH

相关文章：

html - 如何使导航栏中的元素居中？

java - 有什么方法可以使用 JAXB 为集合指定 defaultValue 吗？

mysql - MongoDB存储以及MySQL XPath功能

java - 在 Java 中从 XSD 创建 Xpath

javascript - 使用文件 API 读取 JavaScript 中的文件 "TypeError: e is undefined"

javascript - jQuery 加载并不总是与 Chrome 中的 <picture> 元素一起触发

java - 如何使用 Spring MVC 返回 XML 文件？

c# - 编辑非常大的 xml 文件

php - 使用 DOMDocument 加载包含命名空间的 HTML

html - 在y轴溢出前隐藏滚动条