xml - 使用 Perl 和 LibXML 处理 Excel XML 文件

标签 xml perl excel

我正在尝试处理保存为 XML 电子表格的 Excel 文件中的数据。在做了相当多的研究之后(我之前没有做过太多的 XML 处理),我仍然无法让它工作。这是我的最小文件的内容:

<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:o="urn:schemas-microsoft-com:office:office"
 xmlns:x="urn:schemas-microsoft-com:office:excel"
 xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:html="http://www.w3.org/TR/REC-html40"
 xmlns:fn="http://www.w3.org/2005/xpath-functions"
 xmlns:sbmextension="http://www.serena.com/SBM/XSLT_Extension">
 <Worksheet ss:Name="index">
 </Worksheet>
</Workbook>

还有我的脚本:
use XML::LibXML;
use Data::Dumper;
my $filename = $ARGV[0];
my $parser = XML::LibXML->new();
my $doc    = $parser->parse_file($filename);
my $xc = XML::LibXML::XPathContext->new( $doc->documentElement );
my $xpath = '/Workbook/Worksheet/@ss:Name';

print Dumper $xc->findvalue($xpath);

但是,如果我删除(默认命名空间?) xmlns="urn:schemas-microsoft-com:office:spreadsheet"然后它开始工作。请你能告诉我我错过了什么吗?我想我可以在解析文档之前将其删除,但我想了解我做错了什么:)。提前致谢。

最佳答案

如果要使用 XPath 表达式和命名空间,则必须先注册命名空间,然后每次在所有提到命名空间元素的 XPath 表达式中使用它:

#!/usr/bin/perl
use warnings;
use strict;

use XML::LibXML;
use Data::Dumper;

my $xml = << '__XML__';
<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook
   xmlns="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:o="urn:schemas-microsoft-com:office:office"
 xmlns:x="urn:schemas-microsoft-com:office:excel"
 xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
 xmlns:html="http://www.w3.org/TR/REC-html40"
 xmlns:fn="http://www.w3.org/2005/xpath-functions"
 xmlns:sbmextension="http://www.serena.com/SBM/XSLT_Extension">
 <Worksheet ss:Name="index">
 </Worksheet>
</Workbook>
__XML__

my $doc = XML::LibXML->load_xml( string => $xml);
my $xc  = XML::LibXML::XPathContext->new( $doc->documentElement );
$xc->registerNs('ss', 'urn:schemas-microsoft-com:office:spreadsheet');
my $xpath = '/ss:Workbook/ss:Worksheet/@ss:Name';

print Dumper $xc->findvalue($xpath);

关于xml - 使用 Perl 和 LibXML 处理 Excel XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15878803/

相关文章:

javascript - Chrome 上的 XML 错误但在 FF 上没问题?

iphone - 加载和解析 xml 文档卡住了 Iphone 中的 GUI

php - web中长号的操作

excel - 出现运行时错误 9 - 下标超出范围

python - 当它到达python中的excel文件末尾时退出while循环

c# - 如何使用 Xsd2Code 生成的类

xml - 重新访问混合字符串值的字母数字排序

ajax - 在 perl 中 fork 但从子进程中的系统调用中获取退出状态

启用 javascript 的按钮在 IE 中不正确发布

c# - 如何设置单元格的背景?