c# - 拉出一些div标签并用c#放入json或xml文件格式

标签 c# html css xml json

我想从 html 网页 url 中提取一些 div 标签及其内部标签,并将这些标签转换为 XML 或 JSON 文件格式。我正在寻找解决方案(理论上)来做到这一点。任何人都可以给我任何建议吗?

最佳答案

如果您使用的是 VS2005 及更高版本,这可能会对您有所帮助。使用适用于 Visual Studio 的 Spire.doc 工具。

Spire.Doc 是一个 MS Word 组件,它使用户能够直接执行各种 Word 文档处理任务,例如为 .NET 和 Silverlight 生成、读取、编写和修改 Word 文档。

Spire.Doc 提供了一种将 HTML 转换为 XML 的简单解决方案。我们只需要在 visual studio 中创建一个元素并使用下面简单的 3 行代码。现在,将下面的代码复制到您的元素中以将文件从 HTML 转换为 XML。

[C#]

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Spire.Doc;

namespace Xml2Pdf
{
    class Program
    {
        static void Main(string[] args)
        {
            Document doc = new Document();
            doc.LoadFromFile("sample.html", FileFormat.Html);
            doc.SaveToFile("test.xml", FileFormat.Xml);
        }
    }
}

(注意:如果可行,请为这个答案投票,以便对其他人有所帮助)

问候,

马尼

关于c# - 拉出一些div标签并用c#放入json或xml文件格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28079582/

相关文章:

c# - UML 中的通用类型约束(where 子句)

c# - 为什么 IEnumerable<T>.Select() 在 2 种情况中的 1 种情况下有效?无法从用法推断

javascript - 如何在 JavaScript 中创建嵌套元素?

javascript - 我无法将参数动态传递给 javascript 中的 html 标签

html - CSS flexbox : equal space between elements except the first two of ul>li*7 list

css - 当站点通过 https 服务器时,字体看起来不同

javascript - Fancybox 1.3.4 无法正常工作

c# - 根据 const 值强制 C# 编译器错误

javascript - Jquery 检查是否有父 div 有滚动条

c# - 事务应该处于 WCF 服务级别还是数据库访问级别?