python - Pythons HTMLParser 可以编辑/更改 HTML 元素 innerText 还是只能读取它

标签 python html html-parsing

我正在使用 python 模块 HTMLParser.py

我能够正确解析 HTML,但是否有更改 HTML 元素数据 (innerText) 的选项?

您知道我如何使用 HTMLParser 模块做到这一点吗?

最佳答案

不,HTMLParser 就是这样做的:它通过您的 HTML 进行解析。

您可能正在寻找 Beautiful Soup .它将创建一个 ParseTree——一个 Pythonic 对象树,表示文档的 HTML 元素。然后,您可以搜索所需的对象(元素),为其分配一个新值,瞧!

无耻地从 documentation 中偷走:

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup("<b>Argh!</b>")
soup.find(text="Argh!").replaceWith("Hooray!")
print soup
# <b>Hooray!</b>

关于python - Pythons HTMLParser 可以编辑/更改 HTML 元素 innerText 还是只能读取它,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7655321/

相关文章:

javascript - 将输入值属性设置为带空格的变量。

python - 为什么这个特定的网站在解析时会导致递归错误?

python - 嵌入 CPython : how do you constuct Python callables to wrap C callback pointers?

python - 名称错误。无法将变量分配给数组

Python Pandas 根据另一列对值进行分组和排除

javascript - 在全屏模式 Internet Explorer 中检测事件变化

html - CSS 溢出-y : scroll scrollbar position not in the right place

Python:如何创建包含字典键和值对的列表

c# - HtmlAgilityPack 设置节点 InnerText