我想从一段文本中提取所有的 url 和标题。
Les <a href="http://test.com/blop" class="c_link-blue">résultats du sondage</a> sur les remakes et suites souhaités sont <a href="http://test.com" class="c_link-blue">dans le blog</a>.
由于以下正则表达式,我能够获得所有 href,但我不知道如何另外获得 <a></a>
之间的标题标签?
preg_match_all('/<a.*href="?([^" ]*)" /iU', $v['message'], $urls);
最好是得到一个这样的关联数组
[0] => Array
(
[title] => XXX
[link] => http://test.com/blop
)
[1] => Array
(
[title] => XXX
[link] => http://test.com
)
谢谢你的帮助
最佳答案
如果你仍然坚持使用正则表达式来解决这个问题,你也许可以用这个正则表达式解析一些:
<a.*?href="(.*?)".*?>(.*?)</a>
请注意,它不像您那样使用 U 修饰符。
更新:要让它接受单引号和双引号,您可以改用以下模式:
<a.*?href=(?:"(.*?)"|'(.*?)').*?>(.*?)</a>
关于php - 正则表达式查找所有 URL 和标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7878604/