我开始学习beautifulsoup。我试图从 html 脚本中删除一行包含 </div>
的代码.
文档中的大多数示例都是针对整个标签(开始和结束部分)提供的。
是否可以只修改标签的一部分?
例如:
</div>
<div >Hello</div>
<div data-foo="value">foo!</div>
如何只删除第一行代码?
最佳答案
您可以使用 BeautifulSoup 的 unwrap()
指定无效标签,这将只删除没有打开/关闭对应的额外标签,同时保留其他标签:
soup = BeautifulSoup(html_doc, 'html.parser')
invalid_tags = ['</div>']
for tag in invalid_tags:
for match in soup.findAll(tag):
match.unwrap()
print(soup)
结果:
<div>Hello</div>
<div data-foo="value">foo!</div>
关于python - beautifulsoup - 删除一行代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53272245/