python - XPath 匹配每个包含文本的节点

标签 python xpath lxml scrape

如何递归匹配所有包含文本的子节点。

如果我有一棵像这样的树

table
 tr
  td
   "hello"
  td
   b
    "hi"
 tr
  td
   "salud"
  td
   em
    "bonjour"

如何将表节点中的每个字符串与 xpath 进行匹配? 像“//table/*/text()”之类的东西?

最佳答案

您给出的 XPath 表达式几乎已经正确了:

//table//text()

将获取文档中所有表格内的所有文本节点。

关于python - XPath 匹配每个包含文本的节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5603368/

相关文章:

xml - 将两个数组中的 XML 数据相加

html - 使用 xpaths 进行 HTML 抓取有什么特别需要考虑的吗?

python - 如何让数据挖掘器在网页上进行特定搜索?

python - 在字典中存储 lambda

python - 多次遍历文件(Python)

python - PyQt:如何在不知道项目索引号的情况下设置组合框当前项目

python - 为什么我的 for 循环会覆盖字典中以前的值? (python3)

python内存分配跟踪

xml - 选择元素之间的多个 text() 节点

Python lxml xpath - 返回所有标签而不是所选标签