javascript - 有什么方法可以从 HTML 文档中删除 javascript 代码吗?

标签 javascript python html

我想从 HTML 文档中删除所有 javascript 代码,并保留实际文本。是否有任何正则表达式或 python 脚本可以执行此操作?谢谢。

最佳答案

使用 BeautifulSoup :

#!/usr/bin/env python
from BeautifulSoup import BeautifulSoup

with open("with-scripts.html", "r") as f:
    soup = BeautifulSoup(f.read())

for script in soup("script"):
    script.extract()

with open("without-scripts.html", "w") as f:
    f.write(soup.prettify())

关于javascript - 有什么方法可以从 HTML 文档中删除 javascript 代码吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8283907/

相关文章:

python - Pygame 键按下不工作

html - 使用自动高度滚动将表格列扩展到全宽

javascript - Sequelize js,我们如何在迁移中更改列类型

javascript - jQuery/基础 : Uncaught TypeError: Object #<Object> has no method 'hover'

python - 异步等待 TimerHandle

python - Pymysql库不返回数据库中的纯数据

javascript - jQuery 是否有 "exists"函数?

javascript - 无法从脚本中找到元素

html - YAML 类似于 HTML 的模板语言吗?

javascript - 使用CSS改变不透明度的颜色