c# - XmlReader 不考虑文档类型符号

标签 c# .net xml validation xmlreader

第一次在这些论坛上写文章。虽然已经阅读了很长时间。

我在尝试使用 .Net 中的 XmlReader 验证 Xml 文件时遇到问题。

XML文件:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE root [
  <!NOTATION png PUBLIC "-//W3C//NOTATION Portable Network Graphics//EN">
  <!ENTITY mypic SYSTEM "mypic.png" NDATA png>
]>
<root>
  <img ref="mypic" />
</root>

Xsd文件:

<?xml version="1.0" encoding="utf-8"?>
<xs:schema id="myschema"
    elementFormDefault="qualified"
    xmlns:xs="http://www.w3.org/2001/XMLSchema">
  <xs:element name="img">
    <xs:complexType>
      <xs:attribute name="ref" type="xs:ENTITY" />
    </xs:complexType>
  </xs:element>

  <xs:element name="root">
    <xs:complexType>
      <xs:sequence>
        <xs:element ref="img" />
      </xs:sequence>
    </xs:complexType>
  </xs:element>
</xs:schema>

C# 片段:

XmlReaderSettings settings = new XmlReaderSettings();
settings.ValidationEventHandler += settings_ValidationEventHandler;
settings.ValidationType = ValidationType.Schema;
settings.DtdProcessing = DtdProcessing.Parse;
settings.ValidationFlags |= XmlSchemaValidationFlags.ProcessIdentityConstraints
            | XmlSchemaValidationFlags.ProcessInlineSchema
            | XmlSchemaValidationFlags.ProcessSchemaLocation
            | XmlSchemaValidationFlags.ReportValidationWarnings;

using (XmlReader reader = XmlReader.Create("myschema.xsd")) 
{
    settings.Schemas.Add(XmlSchema.Read(reader, new ValidationEventHandler(settings_ValidationEventHandler)));
}

using (XmlReader reader = XmlReader.Create("mydata.xml", settings))
{
    while (reader.Read()) ;
}

我收到一条验证错误:

Reference to an unparsed entity, 'mypic'.

根据其他验证器,它会验证,但不会根据 XmlReader。

我已经尝试了所有我能想到的方法,所以现在我求助于你们。 非常感谢任何帮助。

最佳答案

通过使用 Reflector,我发现 NOTATION 和 ENTITY 声明确实得到了应有的解析。

验证器将找到您的 mypic 实体引用并将其视为外部且未解析,因为它具有非空的 NDATA 声明。

但是,我还发现每当遇到未解析的实体引用时,验证器总是会发送一个Reference to unparsed entity验证错误。

我不明白为什么 Microsoft 将此报告为错误。在我看来,验证器应该忽略未解析的实体引用或将它们报告为警告,而不是错误。

忽略来自验证器的这些错误并仍然认为 XML 有效应该是安全的,当然,除非报告任何其他错误。

那么,如何确定报告的错误是否是可忽略的Reference to an unparsed entity-error?

我看到三个选项:

  1. 检查错误消息是否以字符串 Reference to an unparsed entity 开头。如果您的代码在非英语平台上运行,这将中断。

  2. 使用反射获取内部GetRes 属性的值,看它是否等于Sch_UnparsedEntityRef。如果 Microsoft 决定更改内部 API,这将中断。

  3. 序列化异常,判断序列化后的res成员是否等于Sch_UnparsedEntityRef。如果 Microsoft 决定更改序列化格式,这将中断。

所有这些选项都是“黑客”。第一个最有可能坏掉。然而,第三个应该是安全的。 Microsoft 不太可能更改序列化格式,因为这可能会破坏与其他代码的兼容性。

以下是如何确定是否忽略在 settings_ValidationEventHandler 方法中收到的验证异常的示例。

基于错误信息(不安全):

    static bool IsUnparsedEntityReferenceError_BasedOnMessage(
        XmlSchemaException error)
    {
        return error != null && error.Message.StartsWith(
            "Reference to an unparsed entity", StringComparison.Ordinal);
    }

基于反射(相当安全):

    static readonly PropertyInfo GetResProp = typeof(XmlSchemaException)
        .GetProperty("GetRes", BindingFlags.NonPublic | BindingFlags.Instance);

    static bool IsUnparsedEntityReferenceError_BasedOnReflection(
        XmlSchemaException error)
    {
        return error != null && GetResProp != null && 
            "Sch_UnparsedEntityRef".Equals(GetResProp.GetValue(error, null));
    }

基于序列化格式(最安全):

    static bool IsUnparsedEntityReferenceError_BasedOnSerializer(
        XmlSchemaException error)
    {
        if (error == null)
        {
            return false;
        }
        else
        {
            SerializationInfo info = new SerializationInfo(
                typeof(XmlSchemaException), new FormatterConverter());

            error.GetObjectData(info, default(StreamingContext));
            return "Sch_UnparsedEntityRef" == info.GetString("res");
        }
    }

关于c# - XmlReader 不考虑文档类型符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13366440/

相关文章:

javax.xml.bind 在 Android Studio (Gradle) 中不工作

c# - 修改表SqlCommand

javascript - ScriptResource.axd 运行时错误 var f=($telerik.isIE)?document.createElement(&lt;iframe name ='"+this.get_id() +"' >")

c# - 确定具有 FlagsAttribute 的枚举是否具有唯一的位值

c# - 如果 watin 中出现对话框,如何默认使测试失败

xml - 如何在 XPath 中使用求和函数?

c# - VS2010 和 WPF 缓慢调试问题

c# - 在多线程 C# 应用程序中嵌入 Python

.net - 如何在运行时将命令行参数传递给 Docker 镜像中的 dotnet dll?

javascript - 使用 javascript 从预先创建的 XML 文件导入数据