java - 显示\t\n为节点的原因是什么?

标签 java html-parsing w3c

让我们解析格式良好的 HTML。

org.w3c.dom.html.HTMLLIElement有一些子节点。

为什么\t\n符号成为单独的节点?

例如图像。前两行 - <div/>和里面的文字。第二两行 - 节点 Text (没有完全这样的标签)带有制表符和结束符。

Image shows normal node <code>div</code> and just text with <code>\n\t</code>

最佳答案

空格仍然是内容,因此自然地,它们可以像字母数字(或其他)字符、标签等一样进行处理

关于java - 显示\t\n为节点的原因是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57632344/

相关文章:

java - 两个 docker 容器之间的通信问题

java - 将依赖项 jar 条目添加到 jar 索引 (/META-INF/INDEX.LIST)

Python:如何向 re.sub() 的替换参数添加计数器

html - LocalStorage 不适用于 PhoneGap

html - 我可以对单个页面中的两个或多个 img html 元素使用相同的值 alt ="name"吗?

html - 当我的页面有两种语言时,在哪里指定 HTML 5 文档的语言?

java - 即使 jar 包含在编译中,程序也找不到 RequestEntity 类

java - 我从 Java Html 5 Web 应用程序返回什么来播放带有音频控制标签的声音文件

python - 为什么我无法从 url 获取轨道标题?

Python HTML 解析器 : UnicodeDecodeError