php - 如何使用 php 从 html 中提取 img src、title 和 alt?

标签 php html regex html-parsing html-content-extraction

我想创建一个页面,其中列出了我网站上的所有图像以及标题和替代表示。

我已经写了一个小程序来查找和加载所有 HTML 文件,但现在我被困在如何提取 srctitlealt 来自这个 HTML:

<img <b>src</b>="/image/fluffybunny.jpg" <b>title</b>="Harvey the bunny" <b>alt</b>="a cute little fluffy bunny" />

我想这应该用一些正则表达式来完成,但由于标签的顺序可能会有所不同,而且我需要所有这些,我真的不知道如何以优雅的方式解析它(我可以做到逐个字符的硬字符,但这很痛苦)。

最佳答案

$url="http://example.com";

$html = file_get_contents($url);

$doc = new DOMDocument();
@$doc->loadHTML($html);

$tags = $doc->getElementsByTagName('img');

foreach ($tags as $tag) {
       echo $tag->getAttribute('src');
}

关于php - 如何使用 php 从 html 中提取 img src、title 和 alt?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/138313/

相关文章:

php - 为什么 include() 不允许工作 setcookie?

javascript - 替换、正则表达式、javascript

javascript - Javascript 正则表达式中的问号(奇怪的行为)

php - 自动生成 PHP 文档?

php - 在 Symfony2 中使用 Pagerfanta 进行分页的正确方法是什么

php - 如何在 PDO 中存储变量

html - 如何为导航选项卡的事件选项卡设置样式

使用 FormData 的 javascript 文件上传问题,收到空的 $_FILES

HTML5 % Height Child of parent with vh 相对高度

python - 在 python 数据框中查找正则表达式