php - 在 php 中不区分大小写的 xpath 搜索

标签 php xpath

我有一个这样的 xml 文件:

<volume name="Early">
<book name="School Years">
<chapter number="1">
<line number="1">Here's the first line with Chicago in it.</line>
<line number="2">Here's a line that talks about Atlanta</line>
<line number="3">Here's a line that says chicagogo </line>
</chapter>
</book>
</volume>

我正在尝试使用 PHP 进行简单的关键字搜索,查找单词并显示它所在的行。我有这个工作

$xml = simplexml_load_file($data);
$keyword = $_GET['keyword'];
$kw=$xml->xpath("//line[contains(text(),'$keyword')]");
...snip...

echo $kw[0]." is the first returned item";

但是,使用这种技术,用户必须搜索“Chicago”而不是“chicago”,否则搜索将不会返回任何结果。

我知道我需要使用翻译功能,但我所有的尝试和错误都是徒劳的。

我试过:

$upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
$lower = "abcdefghijklmnopqrstuvwxyz";
$kw = $xml->xpath("line[contains(text(),'translate('$keyword','$upper','$lower'))]");

但似乎没有任何效果。有小费吗?

最佳答案

Gordon 建议在 XPath 中使用 PHP 函数,如果您选择使用它,将会证明它更加灵活。然而,与他的回答相反,translate字符串函数在 XPath 1.0 中可用,这意味着您可以使用它;你的问题是如何

首先,Charles 在对问题的评论中指出了明显的拼写错误。然后是您如何尝试匹配文本值的逻辑。


在单词形式中,您目前在问“文本是否包含关键字的小写形式?”这并不是您真正想问的。相反,问“小写文本是否包含小写关键字?”将其翻译回 XPath 领域(请原谅双关语)将是:

(注意:为了便于阅读截断字母)

//line[contains(translate(text(),'ABC...Z','abc...z'),'chicago')]

上面将 line 中包含的文本小写然后节点检查它(小写文本)是否包含关键字 chicago .


现在是强制性代码片段(但实际上,上面的想法是您真正需要带回家的):

$xml    = simplexml_load_file($data);
$search = strtolower($keyword);
$nodes  = $xml->xpath("//line[contains(translate(text(), 'ABCDEFGHJIKLMNOPQRSTUVWXYZ', 'abcdefghjiklmnopqrstuvwxyz'), '$search')]");

echo 'Got ' . count($nodes) . ' matches!' . PHP_EOL;
foreach ($nodes as $node){
   echo $node . PHP_EOL;
}

dijon's comment 之后

编辑

在 foreach 中,您可以访问行号、章节号和书名,如下所示。

行号 -- 这只是 <line> 上的一个属性使访问它变得 super 容易的元素。使用 SimpleXML 有两种方法可以访问它:$node['number']$node->attributes()->number (我更喜欢前者)。

第 number - 正如您所说的那样,要做到这一点,我们需要向上遍历树。如果我们使用 DOM 类,我们将有一个方便的 $node->parentNode属性(property)将我们直接带到<chapter> (因为它是我们 <line> 的直接祖先)。 SimpleXML 没有这样一个方便的属性,但我们可以使用相对 XPath 查询来获取它。 parent axis允许我们向上遍历树。

xpath()返回一个数组,我们可以作弊并使用 current()访问从它返回的数组中的第一个(也是唯一一个)项目。那么这只是访问 number 的问题属性如上。

// In the near future we can use: current(...)['number'] but not yet
$chapter = current($node->xpath('./parent::chapter'))->attributes()->number;

书名 -- 此过程与访问章节编号的过程相同。来自 <line> 的相对 XPath 查询可以利用 ancestor axis喜欢./ancestor::book (或 ./parent:chapter/parent::book )。希望你能弄清楚如何访问它的 name属性。

关于php - 在 php 中不区分大小写的 xpath 搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3238989/

相关文章:

php - 如何在 PHP 中处理不匹配的 XPath 表达式结果

PHP 和 PostgreSQL : Avoiding cross-site scripting and SQL injection attacks

php - 如何处理 php 命名空间链接等中的连字符?

php - 如何在 php 中完成验证?

javascript - 获取 JSON 对象的子键名称

java - 如何根据 HTML 为输入元素构建 CSS 选择器

c# - 使用数据集的 xml 到 TreeView

php - Laravel Composer 更新更改的文件

php - 如何转换php中的一些特殊字符?

css - 在 Google 搜索上查找 "Next"按钮的正确 xpath