我需要将此内容提取到 divtestimonial1 div 中 我正在使用以下正则表达式,但它只返回第一行
Regex r = new Regex("<div([^<]*<(?!/div>))");
<div class="testimonial_content" id="divtestimonial1"> <a name="T1"></a> <div class="testimonial_headline">%testimonial1headline</div> <p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span><br /> </p> </div>
最佳答案
Regular expressions are generally not a good choice for parsing HTML .您最好使用诸如 HTML Agility Pack 之类的工具,所以我建议您使用它。
也就是说,您可以使用此正则表达式匹配您的特定示例输入:
<div.*?id="divtestimonial1".*?>.*</div>
但它可能会破坏您的真实场景。 Regex 和 HTML 的问题之一是正确检测标签的嵌套等。
关于c# - 从 Div 标签中提取内容 C# RegEx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4775265/