c# - 如何解析其子字符串中带有粗体、斜体、下划线的 html 标记的字符串

标签 c# html parsing

我在 C# 中为 2D 图形框架创建了某种文本渲染工具。

现在我正在尝试解析其中包含特定 html 标签的文本,例如:

"Hello <b>world</b>!" 

但是解析代码越来越难看,我想,一定有一些库可以做到这一点。最后它应该输出一个数据结构数组,如:

string text;
bool IsBold;
bool IsItalic;
bool IsUnderlined;
...

string text;
FontStyle FontStyle;

有人知道这样的解析器吗?

非常感谢!

最佳答案

HTML Agility Pack是一个很好的 HTML 解析器(也可以解析片段)。

您可以使用 XPath 语法查询它(它类似于 XmlDocument)- 不确定它是否适合您的要求。

关于c# - 如何解析其子字符串中带有粗体、斜体、下划线的 html 标记的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4124168/

相关文章:

parsing - OASIS VLSI 布局文件解析器

使用 Scanner 从标准读取 Java 给出错误结果

c# - 从资源文件中读取字符串并以编程方式编辑它

c# - UWP 中的最近邻渲染

c# - 当 url 是 HTML 编码时,为什么我的 ViewModel 字段变为空?

javascript - 将 django-select2 用于带有图片的下拉列表

html - 仅带有 html 的 Bootstrap 按钮组预选按钮

c# - Linq to SQL insert with primary key as tinyint set to auto-increment 给出错误消息

html - 一个接一个的CSS定位div

windows cmd - 解析文件,输出字符范围,查找唯一值