抱歉,我的问题措辞太糟糕了,但我不知道如何将其表述为问题。只显示代码和解释对我来说更容易。
我正在尝试编写一个允许标记单词的函数。我们有我们称之为词汇表的单词数据库。我想获取大量文本并查找 [G]some word/words here[/G]
的多个实例.然后我想用 <a href="viewglossary.php?word={WORD/WORDS BETWEEN [G][/G]}">{WORD/WORDS BETWEEN [G][/G]}</a>
替换它
这是我当前的功能:
function getGlossary($str)
{
$patterns = array();
$patterns[]='/\[G\](.*)\[\/G\]/';
$replacements = array();
$replacements[]='<a href="viewglossary.php?word=$1">$1</a>';
return preg_replace($patterns, $replacements, $str);
}
echo getGlossary($txt);
如果我只执行 [G][/G]
的单个实例标记它有效。
$txt='What you need to know about [G]beans[/G]';
这将输出
What you need to know about <a href="viewglossary.php?word=beans">beans</a>
然而这
$txt='What you need to know about [G]beans[/G] and [G]corn[/G]';
会输出
What you need to know about <a href="viewglossary.php?word=beans[/G] and [G]corn">beans[/G] and [G]corn</a>
我确定我的模式有问题。任何帮助将不胜感激。
最佳答案
你需要让你的 dot-star 变得懒惰:.*?
- 如果没有
?
来控制.*
,.*
将吃掉所有字符,直到最后的[/G]
*
量词是贪婪的,所以.*
从匹配字符串中的所有字符开始直到最后。然后它只回溯到允许[/G]
匹配所需的程度(因此,它只回溯到最后一个[/G]
)。?
使量词变得“惰性”,因此它们只匹配正则表达式的其余部分所需的范围。因此它只会匹配第一个[/G]
。
像这样修改你的正则表达式:
$pattern = "~\[G\](.*?)\[/G\]~";
请注意,为了使正则表达式更易于阅读,我更改了分隔符并取消了正斜杠的转义,因为除非分隔符是斜杠,否则无需转义斜杠。常见的分隔符包括~
、%
、@
、#
……但真正的波浪线是最美的。 :)
引用
关于php - 当这个词出现多次时,我如何使用具有相同模式的 PHP preg_replace?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24358541/