我想从 html 网页 url 中提取一些 div 标签及其内部标签,并将这些标签转换为 XML 或 JSON 文件格式。我正在寻找解决方案(理论上)来做到这一点。任何人都可以给我任何建议吗?
最佳答案
如果您使用的是 VS2005 及更高版本,这可能会对您有所帮助。使用适用于 Visual Studio 的 Spire.doc 工具。
Spire.Doc 是一个 MS Word 组件,它使用户能够直接执行各种 Word 文档处理任务,例如为 .NET 和 Silverlight 生成、读取、编写和修改 Word 文档。
Spire.Doc 提供了一种将 HTML 转换为 XML 的简单解决方案。我们只需要在 visual studio 中创建一个元素并使用下面简单的 3 行代码。现在,将下面的代码复制到您的元素中以将文件从 HTML 转换为 XML。
[C#]
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Spire.Doc;
namespace Xml2Pdf
{
class Program
{
static void Main(string[] args)
{
Document doc = new Document();
doc.LoadFromFile("sample.html", FileFormat.Html);
doc.SaveToFile("test.xml", FileFormat.Xml);
}
}
}
(注意:如果可行,请为这个答案投票,以便对其他人有所帮助)
问候,
马尼
关于c# - 拉出一些div标签并用c#放入json或xml文件格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28079582/