我想提取 elementB
,然后在元素 C
之前停止和 D
- 即不提取 .text
内容elementC
和 elementD
.但是,我只知道如何提取整个 div 文本,使用 Contents().Not
忽略 elementC
,但是elementD
仍然被捕获。
这是我目前使用的代码:
高语:
capturedText := s.Find("div").Contents().Not(".label").Text()
忽略 elementC
, 但不是 elementD
, 它没有外部标签。
HTML:
<li><span><h2>elementA</h2></span><div>elementB<br><span class="label">elementC</span>elementD</div></li>
如何只捕获 elementB
的 <div>
,而不是 elementC
和 elementD
?
编辑:
我试过像这样关闭 div 标签:
s.Find(".label").BeforeHtml(`</div>`)
也尝试过:
s.Find(".label").BeforeHtml(`</div><div>`)
并访问第一个 div
, 忽略第二个 div
现在应该有 elementD
与:
jp, _ := s.Find("div").First().Html()
但是,这是行不通的。似乎</div>
不能是开放标签 - 它必须是 <div>...</div>
正确插入。但这不是我需要的,我只需要 </div>
或 </div><div>
关闭第一个div
正确。
解决这个问题的合适方法是什么?
最佳答案
由于我无法使用“损坏的”节点编辑 HTML,因此我选择了这个:
s.Find(".label").BeforeHtml(`|_SEPARATOR_|`) // Insert text separator into Html
preCleanNode := s.Find("div").Contents().Not(".label").Text() //Get Html as Text
cleanNode := strings.Split(preCleanNode, `|_SEPARATOR_|`) // Split text based on Text Separator
outputString := cleanNode[0] // Output our wanted text
关于html - GoLang - GoQuery HTML 插入失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42142333/