我们的 CMS 允许用户使用 html 编辑器输入文本,因此在将文本读入网页时,我可以这样输入文本:

 <p>
 <strong>text text. more
text</strong>
 <a href="http://blabla>blabla</a> even more text...
我怎样才能删除除文本之外的所有内容,包括 , 和 .和相似的角色?
最佳答案
假设这是 html(不是 xhtml),我会使用 HTML Agility Pack解析它,并访问 InnerText :
static void Main()
{
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(@"
 <p>
 <strong>text text. more text</strong>
 <a href=""http://blabla>blabla</a> even more text...");
string s = doc.DocumentNode.InnerText;
// s is: 
 
 text text. more text

}
关于c# - 从 html 中删除除文本以外的所有内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1393982/