c# - 使用 C# 从网页中抓取 JSON

标签 c# html-agility-pack

这里是 C# 和运行异步任务的新手。

我正在尝试从网站上抓取一些音乐专辑信息。该网页的搜索以明文形式生成一个 JSON 对象,但我似乎无法访问任何 DOM 信息。这是我尝试过的(使用 HtmlAgilityPack):

using HtmlAgilityPack;
using System;
using System.Threading.Tasks;
using System.Windows.Forms;

namespace WindowsFormsApp1 {
public partial class Form1 : Form {
    public Form1() {
        InitializeComponent();
    }

    public async Task<String> AlbumScraper(string albumname) {

        HtmlWeb web = new HtmlWeb();

        string albumurl = Uri.EscapeUriString("https://www.metal-archives.com/search/ajax-album-search/?field=title&query=" + albumname);
        Console.Write(albumurl);
        var albumdoc = await Task.Factory.StartNew(() => web.Load(albumurl));
        string albumjson = "";

        if (albumdoc.DocumentNode != null) {
            albumjson = albumdoc.DocumentNode.InnerText;
        }

        return albumjson;
    }

    private async void Form1_Load(object sender, EventArgs e) {
        string rawtext = await AlbumScraper("rust+in+peace");
        Console.Write(rawtext);
    }
}
}

如何获取生成的 JSON 文本?当我加载“albumurl”URL 时,我可以清楚地看到它...

最佳答案

可以通过在线工具生成http://json2csharp.com/ 然后将生成的类添加到您的代码中

public class AlbumSearchResponse
    {
        public string error { get; set; }
        public int iTotalRecords { get; set; }
        public int iTotalDisplayRecords { get; set; }
        public int sEcho { get; set; }
        public List<List<string>> aaData { get; set; }
    }

将您的响应文本转换为类

var data = JsonConvert.DeserializeObject<AlbumSearchResponse>(response);
        foreach (var item in data.aaData)
        {
            //do whatever your want with data
        }

你还需要从 nuget 添加 newtonsoft json 包来让 JsonConvert 工作

关于c# - 使用 C# 从网页中抓取 JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44897486/

相关文章:

c# - 在 View 模型中使用 Caliburn 的 conductor<object> 时窗口标题被覆盖

c# - 从 powershell ISE 调用时无法以异步 C# 代码写入控制台

c# - 从 Task<> 获取对象

ant - 如何从 TeamCity 中提取工件?

c# - HTML 敏捷包 : parsing an href tag

c# - 从 Blob 存储读取 PDF 并将其转换为文本

c# - 位图类不处理流?

c# - 使用 HTMLAgilityPack 选择具有属性数据 url 的元素

c# - 如何使用 HTML Agility Pack 获取 <td> 标签内的所有内容?