c# - 从 Div 标签中提取内容 C# RegEx

标签 c# regex html

我需要将此内容提取到 divtestimonial1 div 中 我正在使用以下正则表达式,但它只返回第一行

Regex r = new Regex("&lt;div([^<]*<(?!/div>))");
  <div class="testimonial_content" id="divtestimonial1">
          <a name="T1"></a>
          <div class="testimonial_headline">%testimonial1headline</div>
          <p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span><br />
          </p>
  </div>

最佳答案

Regular expressions are generally not a good choice for parsing HTML .您最好使用诸如 HTML Agility Pack 之类的工具,所以我建议您使用它。

也就是说,您可以使用此正则表达式匹配您的特定示例输入:

<div.*?id="divtestimonial1".*?>.*</div>

但它可能会破坏您的真实场景。 Regex 和 HTML 的问题之一是正确检测标签的嵌套等。

关于c# - 从 Div 标签中提取内容 C# RegEx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4775265/

相关文章:

c# - 在 2 个 ASP.NET MVC 项目之间使用 ASP.NET Identity 进行单点登录

android - 输入表单控件在 android 中不接受 0

c# - 如何绘制迭代 ul-li 列表模式?

正则表达式用逗号替换行尾的多个空格或添加逗号

用于匹配 MongoDB 字符串的正则表达式

python - 正则表达式 split 方法中的分隔符无法正常工作

jquery - 一键显示/隐藏div元素

javascript - 选择没有特定内容的 Div

c# - 在 Owin 启动类中指定域

c# - 以编程方式创建文档 Kentico 9