有一个xml文件:
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
出于某种原因,我更改了<hw>
至 <hw>
和 </hw>
至 </hw>
在使用 lxml 解析器解析它之前。
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
但是修改解析后的xml数据后,我想得到一个<hw>
元素,不是 <hw>
.我该怎么做?
最佳答案
先找一个unescape
函数:
from xml.sax.saxutils import unescape
entry=body[0]
取消转义并替换为原来的:
body.replace(entry, e.fromstring(unescape(e.tounicode(entry))))
关于python - 如何将 < 转换为 < in lxml,Python?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14659423/