xml - XSLT 删除非 ASCII

标签 xml xslt xpath

我需要使用 XSLT 修改 XML 文档。我想用空格替换所有非 ASCII 字符。

示例输入:

<input>azerty12€_étè</input>

只允许使用这些字符:

!"#$%&'()*+,-./0123456789:;=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

预期输出:

 <input>azerty12 _ t </input>

最佳答案

假设您仅限于 XSLT 1.0,您可以尝试:

<xsl:variable name="ascii">!"#$%&amp;'()*+,-./0123456789:;=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[]^_`abcdefghijklmnopqrstuvwxyz{|}~</xsl:variable>
<xsl:variable name="spaces" select="'                                                                                             '" />

<xsl:template match="input">
    <xsl:copy>
        <xsl:value-of select="translate(., translate(., $ascii, ''), $spaces)"/>
    </xsl:copy>
</xsl:template>

这有点 hack:只要 $spaces 变量中有足够的空间来容纳输入中的所有非 ASCII 字符,它就会一直有效。

如果你不想依赖这样的假设,你将不得不使用递归模板来一个接一个地替换它们:

<xsl:template match="input">
    <xsl:copy>
        <xsl:call-template name="replace-non-ascii">
            <xsl:with-param name="text" select="."/>
        </xsl:call-template>
    </xsl:copy>
</xsl:template>

<xsl:template name="replace-non-ascii">
    <xsl:param name="text"/>
    <xsl:variable name="ascii"> !"#$%&amp;'()*+,-./0123456789:;=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[]^_`abcdefghijklmnopqrstuvwxyz{|}~</xsl:variable>
    <xsl:variable name="non-ascii" select="translate($text, $ascii, '')" />
    <xsl:choose>
        <xsl:when test="$non-ascii">
            <xsl:variable name="char" select="substring($non-ascii, 1, 1)" />
            <!-- recursive call -->
            <xsl:call-template name="replace-non-ascii">
                <xsl:with-param name="text" select="translate($text, $char, ' ')"/>
            </xsl:call-template>
        </xsl:when>
        <xsl:otherwise>
            <xsl:value-of select="$text"/>
        </xsl:otherwise>
    </xsl:choose>   
</xsl:template>

关于xml - XSLT 删除非 ASCII,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34932344/

相关文章:

xslt - xsl :if at least one child node exists

xml - 无法添加 xmlns :xlink as an attribute.

python - 获取selenium web元素标签的href值

XPath and and or 语法,写这个 Xpath 的任何更短的方法

android - ADT 在 Strings.xml 中显示错误

c# - 实现 XML 文件转换器时进行单元测试

C# 使用 linq 反序列化 xml

javascript - 在下拉列表中实现垂直滚动条

xml - MSXML : Invalid Class String

xml - fo :external-graphic src ="data:image/png;base64, ..." as attribute