我对所有这些 XML 和 VBA 都很陌生。老实说,我所做的一切都是基于我对 oop 的了解,但我目前正在进行的项目需要在 VBA 中完成。
我到处搜索,但我找不到也想不出任何实用的方法来做我现在必须做的事情,所以如果可能的话,我在这里向大家寻求帮助。
所以基本上我有一个类似这样的 XML 文件:
<a name="something" >
<b name="something">
<c>
<d>number1</d>
<e>number2</e>
<f>
<g>number3</g>
<h>number4</h>
</f>
</c>
</b>
</a>
我的问题是我需要在 Excel 工作表中生成 XML 的内容。我确实知道该怎么做,但是,我最终得到的是这样的:
something
something
number1 number2 number3 number4
number1
number2
number3 number4
number3
number4
我想要的是以某种方式摆脱斜体字。
我在子过程中使用递归,因为这是必需的。但是,当我检查子节点和要打印的节点值时,我最终会得到所有子节点及其本身不具有特定值的节点的值。
我知道我可以使用 baseName 手动跳过节点,但这不是我要找的。如果有可能使它自己的功能或更通用的功能适用于发生这种情况的任何情况,那就太好了。
谢谢你的帮助!
编辑:(我现在拥有的代码)
Sub Main()
Dim XDoc As MSXML2.DOMDocument
Set XDoc = New MSXML2.DOMDocument
Set mainWorkBook = ActiveWorkbook
mainWorkBook.Sheets("Sheet1").Clear
Dim point As IXMLDOMSelection
Filename = ThisWorkbook.Worksheets("Sheet1").Range("A1").Value
XDoc.Load (Filename)
Set point = XDoc.SelectNodes("/*")
Call ProcessChildNodes(point(0))
End Sub
Sub PrintNodeValue(Node As IXMLDOMNode)
If (Node.Attributes.Length = 0) Then
Row = Row + 1
mainWorkBook.Sheets("Sheet1").Cells(Row, 1).Value = Node.Text
End If
End Sub
Sub PrintAttributesValue(Node As IXMLDOMNode)
If (Node.Attributes.Length <> 0) Then
Row = Row + 1
For j = Node.Attributes.Length - 1 To 0 Step -1
strng = Node.Attributes.Length
mainWorkBook.Sheets("Sheet1").Cells(Row, strng - j).Value = Node.Attributes(j).Text
Next
End If
End Sub
Sub ProcessChildNodes(Node As IXMLDOMNode)
If (Node.HasChildNodes) Then
For m = 0 To Node.ChildNodes.Length - 1
If Node.ChildNodes(m).NodeType <> NODE_TEXT Then
Call PrintNodeValue(Node.ChildNodes(m))
Call PrintAttributesValue(Node.ChildNodes(m))
Call ProcessChildNodes(Node.ChildNodes(m))
End If
Next
Else
End If
End Sub
最佳答案
如果我理解正确你想忽略有
的节点- 没有文字输入
- 没有属性
在你的例子中 <c>
和 <f>
.
我发现的唯一技巧是直接处理 XML。
所以我们首先搜索一个唯一的参数,只有节点<c>
和 <f>
有但没有其他节点。因此我找到了这个规则:
- 节点不能有属性
- 该节点必须紧跟另一个节点(无文本)
这意味着在 <c>
之后和 <f>
直接有另一个以<
开头的标签.
理论
如果我们看一下节点
<c>
的 XML 代码我们得到Node.xml
它看起来像:<c> <d>number1</d> <e>number2</e> <f> <g>number3</g> <h>number4</h> </f> </c>
为了更容易处理,我们将换行符、制表符和空格变平,所以我们在这里结束:
<c><d>number1</d><e>number2</e><f><g>number3</g><h>number4</h></f></c>
现在我们只需要检查第一个节点标签是否为
<c>
直接后跟另一个以<
开头的标签.因此我们找到第一个>
看看它后面是不是<
.如果这是真的,那么可以省略该节点,因为它没有属性,也没有文本。
让我们开始编码
我们在
PrintNodeValue
中做所有事情程序并从声明一个变量并获取实际处理节点的原始 XML 代码开始:Dim xml as String xml = Node.xml
我们将
xml
展平并删除所有换行符、制表符和空格xml = Replace(xml, vbCrLf, vbNullString) xml = Replace(xml, vbTab, vbNullString) xml = Replace(xml, " ", vbNullString)
xml
现在是<c><d>number1</d><e>number2</e><f><g>number3</g><h>number4</h></f></c>
我们删除第一个标签
xml = Right(xml, Len(xml) - InStr(1, xml, ">"))
看看我们的 2 条规则(没有属性,后面跟着另一个标签直接适用)
If (Node.Attributes.Length = 0) And Left(xml, 1) <> "<" Then
所以我们最终得到...
Sub PrintNodeValue(Node As IXMLDOMNode)
Dim xml As String
xml = Node.xml 'get raw xml
xml = Replace(xml, vbCrLf, vbNullString) 'strip off line breaks
xml = Replace(xml, vbTab, vbNullString) 'strip off tabs
xml = Replace(xml, " ", vbNullString) 'strip off spaces
xml = Right(xml, Len(xml) - InStr(1, xml, ">")) 'strip off first tag
If (Node.Attributes.Length = 0) And Left(xml, 1) <> "<" Then 'check our 2 rules
iRow = iRow + 1
mainWorkBook.Sheets("Sheet1").Cells(iRow, 1).Value = Node.Text
End If
End Sub
产生……
something
something
number1
number2
number3
number4
请注意,您可能需要更改 vbCrLf
至 vbCr
或 vbLf
取决于来自哪个系统,例如。 Windows、Linux 或 Mac XML 文件最初来自(它们使用不同的换行符)。为了安全起见,您也可以删除所有 3 个。
xml = Replace(xml, vbCrLf, vbNullString)
xml = Replace(xml, vbCr, vbNullString)
xml = Replace(xml, vbLf, vbNullString)
关于xml - 是否可以在 Excel VBA 中跳过 XML 文件中的节点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45342509/