<分区>
Possible Duplicate:
Decode HTML entities in Python string?
我已经解析了一些 HTML 文本。但是一些标点符号如撇号被替换为’
。如何将它们还原为 `
P.S: 我正在使用 Python/Feedparser
谢谢
<分区>
Possible Duplicate:
Decode HTML entities in Python string?
我已经解析了一些 HTML 文本。但是一些标点符号如撇号被替换为’
。如何将它们还原为 `
P.S: 我正在使用 Python/Feedparser
谢谢
最佳答案
PSF Wiki 有一些方法可以做到这一点。这是一种方法:
import htmllib
def unescape(s):
p = htmllib.HTMLParser(None)
p.save_bgn()
p.feed(s)
return p.save_end()
关于python - 使用 Python 将 HTML 表示形式替换为 ascii,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8057486/