php - 在 php 中不区分大小写的 xpath 搜索

我有一个这样的 xml 文件:

<volume name="Early">
<book name="School Years">
<chapter number="1">
<line number="1">Here's the first line with Chicago in it.</line>
<line number="2">Here's a line that talks about Atlanta</line>
<line number="3">Here's a line that says chicagogo </line>
</chapter>
</book>
</volume>

我正在尝试使用 PHP 进行简单的关键字搜索，查找单词并显示它所在的行。我有这个工作

$xml = simplexml_load_file($data);
$keyword = $_GET['keyword'];
$kw=$xml->xpath("//line[contains(text(),'$keyword')]");
...snip...

echo $kw[0]." is the first returned item";

但是，使用这种技术，用户必须搜索“Chicago”而不是“chicago”，否则搜索将不会返回任何结果。

我知道我需要使用翻译功能，但我所有的尝试和错误都是徒劳的。

我试过:

$upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
$lower = "abcdefghijklmnopqrstuvwxyz";
$kw = $xml->xpath("line[contains(text(),'translate('$keyword','$upper','$lower'))]");

但似乎没有任何效果。有小费吗？

最佳答案

Gordon 建议在 XPath 中使用 PHP 函数，如果您选择使用它，将会证明它更加灵活。然而，与他的回答相反，translate字符串函数在在 XPath 1.0 中可用，这意味着您可以使用它；你的问题是如何。

首先，Charles 在对问题的评论中指出了明显的拼写错误。然后是您如何尝试匹配文本值的逻辑。

在单词形式中，您目前在问“文本是否包含关键字的小写形式？”这并不是您真正想问的。相反，问“小写文本是否包含小写关键字？”将其翻译回 XPath 领域(请原谅双关语)将是:

^{(注意:为了便于阅读截断字母)}

//line[contains(translate(text(),'ABC...Z','abc...z'),'chicago')]

上面将 line 中包含的文本小写然后节点检查它(小写文本)是否包含关键字 chicago .

现在是强制性代码片段(但实际上，上面的想法是您真正需要带回家的):

$xml    = simplexml_load_file($data);
$search = strtolower($keyword);
$nodes  = $xml->xpath("//line[contains(translate(text(), 'ABCDEFGHJIKLMNOPQRSTUVWXYZ', 'abcdefghjiklmnopqrstuvwxyz'), '$search')]");

echo 'Got ' . count($nodes) . ' matches!' . PHP_EOL;
foreach ($nodes as $node){
   echo $node . PHP_EOL;
}

在dijon's comment 之后

编辑

在 foreach 中，您可以访问行号、章节号和书名，如下所示。

行号 -- 这只是 <line> 上的一个属性使访问它变得 super 容易的元素。使用 SimpleXML 有两种方法可以访问它:$node['number']或 $node->attributes()->number (我更喜欢前者)。

第 number - 正如您所说的那样，要做到这一点，我们需要向上遍历树。如果我们使用 DOM 类，我们将有一个方便的 $node->parentNode属性(property)将我们直接带到<chapter> (因为它是我们 <line> 的直接祖先)。 SimpleXML 没有这样一个方便的属性，但我们可以使用相对 XPath 查询来获取它。 parent axis允许我们向上遍历树。

自 xpath()返回一个数组，我们可以作弊并使用 current()访问从它返回的数组中的第一个(也是唯一一个)项目。那么这只是访问 number 的问题属性如上。

// In the near future we can use: current(...)['number'] but not yet
$chapter = current($node->xpath('./parent::chapter'))->attributes()->number;

书名 -- 此过程与访问章节编号的过程相同。来自 <line> 的相对 XPath 查询可以利用 ancestor axis喜欢./ancestor::book (或 ./parent:chapter/parent::book )。希望你能弄清楚如何访问它的 name属性。

关于php - 在 php 中不区分大小写的 xpath 搜索，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3238989/

php - 在 php 中不区分大小写的 xpath 搜索

上一篇：php - Xdebug成功连接到DBGP客户端，但不会在断点处停止

下一篇：php - 创建 "two way"配置文件