我有一个页面,其中包含一些指向该格式的 .mp3/.wav 文件的链接
<a href="http://siteName/subfolder/filename.mp3">File Name</a>
我需要制作一个脚本来下载所有这些文件,而不是自己下载
我知道我可以使用正则表达式来做类似的事情,但我不知道如何做?最好的选择是什么(Java、C#、JavaScript)?
任何帮助将不胜感激
提前致谢
最佳答案
您可以使用SgmlReader解析DOM并提取所有 anchor 链接,然后下载相应的资源:
class Program
{
static void Main()
{
using (var reader = new SgmlReader())
{
reader.DocType = "HTML";
reader.Href = "http://www.example.com";
var doc = new XmlDocument();
doc.Load(reader);
var anchors = doc.SelectNodes("//a/@href[contains(., 'mp3') or contains(., 'wav')]");
foreach (XmlAttribute href in anchors)
{
using (var client = new WebClient())
{
var data = client.DownloadData(href.Value);
// TODO: do something with the downloaded data
}
}
}
}
}
关于c# - 制作脚本从页面下载所有 Mp3 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3896262/