我想将维基百科中的一张表放入 xml 文件中,然后将其解析为 C#。是否可以?如果是,我可以仅在 xml 中保存 Title 和 Genre 列吗?
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://en.wikipedia.org/wiki/2012_in_film");
HtmlNode node = doc.DocumentNode.SelectSingleNode("//table[@class='wikitable']");
最佳答案
您可以使用网络浏览器:
//First navigate to your address
webBrowser1.Navigate("http://en.wikipedia.org/wiki/2012_in_film");
List<string> Genre = new List<string>();
List<string> Title = new List<string>();
//When page loaded
foreach (HtmlElement table in webBrowser1.Document.GetElementsByTagName("table"))
{
if (table.GetAttribute("className").Equals("wikitable"))
{
foreach (HtmlElement tr in table.GetElementsByTagName("tr"))
{
int columncount = 1;
foreach (HtmlElement td in tr.GetElementsByTagName("td"))
{
//Title
if (columncount == 4)
{
Title.Add(td.InnerText);
}
//Genre
if (columncount == 7)
{
Genre.Add(td.InnerText);
}
columncount++;
}
}
}
}
现在您有两个列表(类型和标题)。 您可以简单地将它们转换为 xml 文件
关于c# - 如何从维基百科获取表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14035674/