所以我从数据库中获取链接,这些链接看起来像这样:
www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html
www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm
www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html
在我的 foreach 循环中,Urls 表示为 $row['links'];
我想做的是只采用 RANDOM-URL-TITLE-NEED。这意味着我需要 url 中从最后一个斜杠(在随机代码之后)到 URL 末尾的文本。
我正在使用这个预匹配函数来获取我需要的东西,但似乎我在开始时使用 regerx 失败了(?)。任何建议:
preg_match('#/(?:.*?).htm#is', $row['links'], $vardas);
$vardas = $vardas[0];
最佳答案
您实际上匹配第一个 /
,然后匹配任何 1+ 个字符,直到第一个 htm
。
我相信你需要
#/([^/]*)\.html?$#i
参见 regex demo
详细信息:
/
- 文字/
([^/]*)
- 第 1 组捕获除/
以外的 0+ 个字符
\.
- 文字.
html?
-html
或htm
$
- 字符串结尾
preg_filter
模式的变体(如果您传递一个字符串数组):
$urls = array("www.website.com/games/RANDOM-URL-TITLE-NOT_NEEDED.xhtml",
"www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html",
"www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm",
"www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html");
print_r(preg_filter('#^.*/(.*)\.html?$#i', '$1', $urls));
参见 PHP demo , 只返回
[1] => RANDOM-URL-TITLE-NEEDED
[2] => RANDOM-URL-TITLE-NEEDED2
[3] => RANDOM-URL-TITLE-NEEDED3
更新后的正则表达式模式匹配:
^
- 字符串的开始.*/
- 除了换行符之外的 0+ 个字符,直到最后一个/
和斜杠本身(.*)
- 第 1 组捕获除换行符以外的任何 0+ 个字符,直到最后一个为止\.html?
-.htm
或.html
子字符串在...$
- 字符串的结尾。
$1
是对捕获到组 1 中的值的反向引用。
关于php - 正则表达式 preg_match 未按预期工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39484033/