python - 用 python 替换 HTML 中的粗体标题

标签 python html html-parsing

这个问题在这里已经有了答案:





How to change tag name with BeautifulSoup?

(3 个回答)


3个月前关闭。




我有一些像这样的 HTML 文本:

'<H1 LANG="es-ES" CLASS="western" STYLE="text-indent: -0.5cm; line-height: 100%"><FONT FACE="Arial, sans-serif"><FONT SIZE=3>some_text_here</FONT></FONT></H1>'
在较大的 HTML 文本中。我想自动识别所有此类标题并将它们更改为简单的粗体文本:
'<B LANG="es-ES" CLASS="western" STYLE="text-indent: -0.5cm; line-height: 100%"><FONT FACE="Arial, sans-serif"><FONT SIZE=3>some_text_here</FONT></FONT></B>'
使用正则表达式并不是最好的,因为有时标题开始和结束在不同的行上。

最佳答案

您可以使用 BeautifulSoup但一个简单的方法是使用 re.sub()形式如下:

   html_content = re.sub("<H\d", "<B", html_content)
   html_content = re.sub("<\/H\d>", "</B>", html_content)

关于python - 用 python 替换 HTML 中的粗体标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68869456/

相关文章:

python - 如何从 Pandas 数据框中创建列名、行名和值的列表?

c# - 可以在开关 {case} 中使用通配符或字符串 "contains"吗?注意 : wordy

python - 根据 for 循环中的迭代次数向列表添加不同的值

php - 双选择框无法正确发布

html - Url 编码和 HTML 编码的区别

python - 从 abaqus 的 python 脚本读取 excel 数据

python - 如何在 heroku 上托管 cython web 应用程序?

python - 如何在同一测试用例中使用假设和基于 pytest-tornado 产量的测试?

javascript - 可点击表格单元格内的按钮

html - 已安装背景图片