我有一个这样的 xml 文件:
<volume name="Early">
<book name="School Years">
<chapter number="1">
<line number="1">Here's the first line with Chicago in it.</line>
<line number="2">Here's a line that talks about Atlanta</line>
<line number="3">Here's a line that says chicagogo </line>
</chapter>
</book>
</volume>
我正在尝试使用 PHP 进行简单的关键字搜索,查找单词并显示它所在的行。我有这个工作
$xml = simplexml_load_file($data);
$keyword = $_GET['keyword'];
$kw=$xml->xpath("//line[contains(text(),'$keyword')]");
...snip...
echo $kw[0]." is the first returned item";
但是,使用这种技术,用户必须搜索“Chicago”而不是“chicago”,否则搜索将不会返回任何结果。
我知道我需要使用翻译功能,但我所有的尝试和错误都是徒劳的。
我试过:
$upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
$lower = "abcdefghijklmnopqrstuvwxyz";
$kw = $xml->xpath("line[contains(text(),'translate('$keyword','$upper','$lower'))]");
但似乎没有任何效果。有小费吗?
最佳答案
Gordon 建议在 XPath 中使用 PHP 函数,如果您选择使用它,将会证明它更加灵活。然而,与他的回答相反,translate
字符串函数在在 XPath 1.0 中可用,这意味着您可以使用它;你的问题是如何。
首先,Charles 在对问题的评论中指出了明显的拼写错误。然后是您如何尝试匹配文本值的逻辑。
在单词形式中,您目前在问“文本是否包含关键字的小写形式?”这并不是您真正想问的。相反,问“小写文本是否包含小写关键字?”将其翻译回 XPath 领域(请原谅双关语)将是:
(注意:为了便于阅读截断字母)
//line[contains(translate(text(),'ABC...Z','abc...z'),'chicago')]
上面将 line
中包含的文本小写然后节点检查它(小写文本)是否包含关键字 chicago
.
现在是强制性代码片段(但实际上,上面的想法是您真正需要带回家的):
$xml = simplexml_load_file($data);
$search = strtolower($keyword);
$nodes = $xml->xpath("//line[contains(translate(text(), 'ABCDEFGHJIKLMNOPQRSTUVWXYZ', 'abcdefghjiklmnopqrstuvwxyz'), '$search')]");
echo 'Got ' . count($nodes) . ' matches!' . PHP_EOL;
foreach ($nodes as $node){
echo $node . PHP_EOL;
}
在dijon's comment 之后
编辑
在 foreach 中,您可以访问行号、章节号和书名,如下所示。
行号 -- 这只是 <line>
上的一个属性使访问它变得 super 容易的元素。使用 SimpleXML 有两种方法可以访问它:$node['number']
或 $node->attributes()->number
(我更喜欢前者)。
第 number - 正如您所说的那样,要做到这一点,我们需要向上遍历树。如果我们使用 DOM 类,我们将有一个方便的 $node->parentNode
属性(property)将我们直接带到<chapter>
(因为它是我们 <line>
的直接祖先)。 SimpleXML 没有这样一个方便的属性,但我们可以使用相对 XPath 查询来获取它。 parent axis允许我们向上遍历树。
自 xpath()
返回一个数组,我们可以作弊并使用 current()
访问从它返回的数组中的第一个(也是唯一一个)项目。那么这只是访问 number
的问题属性如上。
// In the near future we can use: current(...)['number'] but not yet
$chapter = current($node->xpath('./parent::chapter'))->attributes()->number;
书名 -- 此过程与访问章节编号的过程相同。来自 <line>
的相对 XPath 查询可以利用 ancestor axis喜欢./ancestor::book
(或 ./parent:chapter/parent::book
)。希望你能弄清楚如何访问它的 name
属性。
关于php - 在 php 中不区分大小写的 xpath 搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3238989/