xml - 是否可以在 Excel VBA 中跳过 XML 文件中的节点?

标签 xml vba excel xml-parsing

我对所有这些 XML 和 VBA 都很陌生。老实说,我所做的一切都是基于我对 oop 的了解,但我目前正在进行的项目需要在 VBA 中完成。
我到处搜索,但我找不到也想不出任何实用的方法来做我现在必须做的事情,所以如果可能的话,我在这里向大家寻求帮助。

所以基本上我有一个类似这样的 XML 文件:

<a name="something" >
   <b name="something">
      <c>
         <d>number1</d>
         <e>number2</e>
         <f>
            <g>number3</g>
            <h>number4</h>
         </f>
       </c>
    </b>
</a>

我的问题是我需要在 Excel 工作表中生成 XML 的内容。我确实知道该怎么做,但是,我最终得到的是这样的:

something
something
number1 number2 number3 number4
number1
number2
number3 number4
number3
number4

我想要的是以某种方式摆脱斜体字。

我在子过程中使用递归,因为这是必需的。但是,当我检查子节点和要打印的节点值时,我最终会得到所有子节点及其本身不具有特定值的节点的值。

我知道我可以使用 baseName 手动跳过节点,但这不是我要找的。如果有可能使它自己的功能或更通用的功能适用于发生这种情况的任何情况,那就太好了。

谢谢你的帮助!

编辑:(我现在拥有的代码)

Sub Main()
    Dim XDoc As MSXML2.DOMDocument
    Set XDoc = New MSXML2.DOMDocument

    Set mainWorkBook = ActiveWorkbook
    mainWorkBook.Sheets("Sheet1").Clear

    Dim point As IXMLDOMSelection

    Filename = ThisWorkbook.Worksheets("Sheet1").Range("A1").Value
    XDoc.Load (Filename)

    Set point = XDoc.SelectNodes("/*")
    Call ProcessChildNodes(point(0))
End Sub


Sub PrintNodeValue(Node As IXMLDOMNode)
    If (Node.Attributes.Length = 0) Then
        Row = Row + 1
        mainWorkBook.Sheets("Sheet1").Cells(Row, 1).Value = Node.Text
    End If
End Sub


Sub PrintAttributesValue(Node As IXMLDOMNode)
    If (Node.Attributes.Length <> 0) Then
        Row = Row + 1
        For j = Node.Attributes.Length - 1 To 0 Step -1
            strng = Node.Attributes.Length
            mainWorkBook.Sheets("Sheet1").Cells(Row, strng - j).Value = Node.Attributes(j).Text
        Next
    End If
End Sub


Sub ProcessChildNodes(Node As IXMLDOMNode) 
    If (Node.HasChildNodes) Then
        For m = 0 To Node.ChildNodes.Length - 1
            If Node.ChildNodes(m).NodeType <> NODE_TEXT Then
                Call PrintNodeValue(Node.ChildNodes(m))
                Call PrintAttributesValue(Node.ChildNodes(m))
                Call ProcessChildNodes(Node.ChildNodes(m))
            End If
        Next
    Else
    End If
End Sub

最佳答案

如果我理解正确你想忽略有

的节点
  • 没有文字输入
  • 没有属性

在你的例子中 <c><f> .


我发现的唯一技巧是直接处理 XML。 所以我们首先搜索一个唯一的参数,只有节点<c><f>有但没有其他节点。因此我找到了这个规则:

  1. 节点不能有属性
  2. 该节点必须紧跟另一个节点(无文本)

这意味着在 <c> 之后和 <f>直接有另一个以<开头的标签.

理论

  1. 如果我们看一下节点 <c> 的 XML 代码我们得到 Node.xml它看起来像:

    <c>
        <d>number1</d>
        <e>number2</e>
        <f>
            <g>number3</g>
            <h>number4</h>
        </f>
    </c>
    
  2. 为了更容易处理,我们将换行符、制表符和空格变平,所以我们在这里结束:

    <c><d>number1</d><e>number2</e><f><g>number3</g><h>number4</h></f></c>
    
  3. 现在我们只需要检查第一个节点标签是否为<c> 直接后跟另一个以<开头的标签.因此我们找到第一个 >看看它后面是不是< .如果这是真的,那么可以省略该节点,因为它没有属性,也没有文本。

让我们开始编码

  1. 我们在 PrintNodeValue 中做所有事情程序并从声明一个变量并获取实际处理节点的原始 XML 代码开始:

    Dim xml as String
    xml = Node.xml
    
  2. 我们将 xml 展平并删除所有换行符、制表符和空格

    xml = Replace(xml, vbCrLf, vbNullString)
    xml = Replace(xml, vbTab, vbNullString)
    xml = Replace(xml, " ", vbNullString)
    

    xml现在是<c><d>number1</d><e>number2</e><f><g>number3</g><h>number4</h></f></c>

  3. 我们删除第一个标签

    xml = Right(xml, Len(xml) - InStr(1, xml, ">"))
    

    看看我们的 2 条规则(没有属性,后面跟着另一个标签直接适用)

    If (Node.Attributes.Length = 0) And Left(xml, 1) <> "<" Then
    

所以我们最终得到...

Sub PrintNodeValue(Node As IXMLDOMNode)
    Dim xml As String
    xml = Node.xml                                  'get raw xml
    xml = Replace(xml, vbCrLf, vbNullString)        'strip off line breaks
    xml = Replace(xml, vbTab, vbNullString)         'strip off tabs
    xml = Replace(xml, " ", vbNullString)           'strip off spaces
    xml = Right(xml, Len(xml) - InStr(1, xml, ">")) 'strip off first tag

    If (Node.Attributes.Length = 0) And Left(xml, 1) <> "<" Then 'check our 2 rules
        iRow = iRow + 1
        mainWorkBook.Sheets("Sheet1").Cells(iRow, 1).Value = Node.Text
    End If
End Sub

产生……

something
something
number1
number2
number3
number4

请注意,您可能需要更改 vbCrLfvbCrvbLf取决于来自哪个系统,例如。 Windows、Linux 或 Mac XML 文件最初来自(它们使用不同的换行符)。为了安全起见,您也可以删除所有 3 个。

xml = Replace(xml, vbCrLf, vbNullString)
xml = Replace(xml, vbCr, vbNullString)
xml = Replace(xml, vbLf, vbNullString)

关于xml - 是否可以在 Excel VBA 中跳过 XML 文件中的节点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45342509/

相关文章:

c# - xml 错误 : Object reference not set to an instance of an object after SelectSingleNode

按钮上的 Android ADT 文字

xml - xsd:dateTime 到 Java OffsetDateTime

vba - 使用多个 IF 语句加速代码的方法

excel - 隐藏/取消隐藏最后写入的行

vba - 如何使用 VBA 在文本文件中的句子(用破折号)下划线

android - 如何在android中创建像windows输入键一样的编辑文本

vba - 如何使 For-Each 循环向后运行

如果满足多个条件,VBA 复制数据

vba - 散点图绘制excel VBA - 不会绘制我的数据范围