php - 正则表达式 preg_match 未按预期工作

标签 php regex preg-match

所以我从数据库中获取链接,这些链接看起来像这样:

www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html
www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm
www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html

在我的 foreach 循环中,Urls 表示为 $row['links']; 我想做的是只采用 RANDOM-URL-TITLE-NEED。这意味着我需要 url 中从最后一个斜杠(在随机代码之后)到 URL 末尾的文本。 我正在使用这个预匹配函数来获取我需要的东西,但似乎我在开始时使用 regerx 失败了(?)。任何建议:

preg_match('#/(?:.*?).htm#is', $row['links'], $vardas);
$vardas = $vardas[0];

最佳答案

您实际上匹配第一个 /,然后匹配任何 1+ 个字符,直到第一个 htm

我相信你需要

#/([^/]*)\.html?$#i

参见 regex demo

详细信息:

  • / - 文字 /
  • ([^/]*) - 第 1 组捕获除 /
  • 以外的 0+ 个字符
  • \. - 文字 .
  • html? - htmlhtm
  • $ - 字符串结尾

preg_filter 模式的变体(如果您传递一个字符串数组):

$urls = array("www.website.com/games/RANDOM-URL-TITLE-NOT_NEEDED.xhtml",
    "www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html",
    "www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm",
    "www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html");

print_r(preg_filter('#^.*/(.*)\.html?$#i', '$1', $urls));

参见 PHP demo , 只返回

[1] => RANDOM-URL-TITLE-NEEDED
[2] => RANDOM-URL-TITLE-NEEDED2
[3] => RANDOM-URL-TITLE-NEEDED3

更新后的正则表达式模式匹配:

  • ^ - 字符串的开始
  • .*/ - 除了换行符之外的 0+ 个字符,直到最后一个 / 和斜杠本身
  • (.*) - 第 1 组捕获除换行符以外的任何 0+ 个字符,直到最后一个为止
  • \.html? - .htm.html 子字符串在...
  • $ - 字符串的结尾。

$1 是对捕获到组 1 中的值的反向引用。

关于php - 正则表达式 preg_match 未按预期工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39484033/

相关文章:

javascript - 如何验证 HTML5 日期格式

php - 时间转换为小时和分钟,包括 am 和 pm

php - do...while 循环迭代次数太多,while 循环迭代次数太少 - php

正则表达式匹配不会在 perl 中产生输出

regex - 查找不以 "<"开头的行,执行操作

Java:从显示 ArrayList 的 Stringbuffer 中删除括号和逗号

php - 使用 preg_match 检查字符串的结构

php - 如何在php中将不同时区的日期和时间转换为GMT时间

php - 预匹配问题

php - 如何在 PHP 中获取 DIV 的 HTML 内容