html - 将 HTML 实体 (#nnnn;) 转义为纯 UTF-8

标签 html unix utf-8

<分区>

我们有 HTML 源文件,其中包含编码为 &#nnnn; 的特殊字符,例如:

außergewöhnlich

我们想将它们转换成普通的 UTF-8:

außergewöhnlich

有什么小工具可以做到这一点吗?

最佳答案

你可以用 perl 和 HTML::Entities 来做到这一点如果你愿意的话。

echo 'echo 'au&#223;ergew&#246;hnlich' |
perl -MHTML::Entities -pe'binmode STDOUT, ":utf8"; HTML::Entities::decode_entities($_)'

关于html - 将 HTML 实体 (#nnnn;) 转义为纯 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3093342/

相关文章:

html - Bootstrap CSS : align two forms buttons

linux - 调度算法如何确定进程类型(I/O,CPU bound)

Unix : how to tar only N first files of each folder?

python - "surrogateescape"无法转义某些字符

java - mysql如何去除不适合utf8编码的坏字符?

jquery - 使用 showModalDialog 或 jQuery 对话框

html - 提速网页

c - getopt(3) 如何工作, 'extern' 变量 optarg 是什么?

php - 将(双字节)字符串转换为十六进制

html - 如何安全地将用户提供的 URL 添加到我的 HTML 页面?