我正在读取一个文本文件并将其内容放入 xml 输出文件的标签内。我面临的问题是输入文本文件包含一些控制字符,例如 <96>
或<92>
这导致我的脚本输出无效的 xml。
如何将这些控制字符转换为相应的数字 HTML 实体,以便不会丢失数据并且生成的文件也有效?
我已经尝试过:
perl -p -i -e 's/\x96/\&\#150\;/g; s/\x92/\&\#146\;/g;' out_xml
但我想将任何控制字符转换为 HTML 实体。
最佳答案
HTML::Entities做你想做的事:
$ perl -MHTML::Entities -le 'print encode_entities("\x96\x92")'
–’
关于xml - 如何将控制字符转换为 HTML 实体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13721943/