我想创建一个页面,其中列出了我网站上的所有图像以及标题和替代表示。
我已经写了一个小程序来查找和加载所有 HTML 文件,但现在我被困在如何提取 src
、title
和 alt
来自这个 HTML:
<img <b>src</b>="/image/fluffybunny.jpg" <b>title</b>="Harvey the bunny" <b>alt</b>="a cute little fluffy bunny" />
我想这应该用一些正则表达式来完成,但由于标签的顺序可能会有所不同,而且我需要所有这些,我真的不知道如何以优雅的方式解析它(我可以做到逐个字符的硬字符,但这很痛苦)。
最佳答案
$url="http://example.com";
$html = file_get_contents($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$tags = $doc->getElementsByTagName('img');
foreach ($tags as $tag) {
echo $tag->getAttribute('src');
}
关于php - 如何使用 php 从 html 中提取 img src、title 和 alt?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/138313/