我有一个带有 javascript 的 XSLT,它使用“<”和“>” for循环内部
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/">
<html>
<head> </head>
<body>
<script language="javascript" type="text/javascript">
function example() {
var trs = document.getElementsByTagName("tr");
for (var i = 0; i < trs.length; i++) {
}
}
</script>
</body>
</html>
我正在使用 PYTHON LXML 库通过 XSLT 和 XML 生成 HTML。
import lxml.etree as ET
xml = ET.parse('sample.xml')
xslt = ET.parse('sample.xsl')
transform = ET.XSLT(xslt)
content = transform(xml)
f = open('output.html','w')
f.write(ET.tostring(content , pretty_print=True))
f.close()
但 LXML 无法替换输出 HTML 文件中的特殊字符
<;到 '<' 和 > ;到 '>'
是否有使用 LXML 替换“<”的标准做法?到“<”?
为了解决这个问题,我必须在写入文件之前再写一段代码。
content = content.replace(">", ">")
content = content.replace("<", "<")
最佳答案
为了解码/转换 HTML 实体,您应该在 tostring()
调用中使用 method="html"
:
ET.tostring(content, method="html", pretty_print=True)
或:
lxml.html.tostring(content, pretty_print=True)
演示:
from lxml import etree
text = """<html>
<body>
<script> 1 < 2 </script>
</body>
</html>
"""
tree = etree.fromstring(text)
print etree.tostring(tree, method="html")
打印:
<html>
<body>
<script> 1 < 2 </script>
</body>
</html>
关于javascript - Python lxml 库无法解析 < 和 >,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19017253/