c# - 提取链接正则表达式 c#

标签 c# regex capturing-group

过去两个小时我一直在尝试解决这些问题,但似乎找不到任何解决方案。

我需要从 HTML 中提取链接文件。有 100 多个链接,但其中只有 25 个有效。

有效链接放在里面

<td><a href=" (link) ">

首先,我曾经(现在仍然)遇到逐字字符串中双引号的问题。所以,我已经用“普通”字符串逐字替换,所以我可以使用\"for "但问题是这个 Regex我写的不行

Match LinksTemp = Regex.Match(
                              htmlCode,
                              "<td><a href=\"(.*)\">",
                              RegexOptions.IgnoreCase);

当我得到 "<td><a href="http://www.google.com">作为输出而不是 http://www.google.com

任何人都知道如何解决这个问题以及如何在逐字字符串中使用双引号(示例 @"<>"das"sa ")

最佳答案

转义双引号示例:@"some""test"
正则表达式示例:"<a href=\"(.*?)\">"

    var match = Regex.Match(html, "<td><a href=\"(.*?)\">", 
RegexOptions.Singleline); //spelling error
    var url = match.Groups[1].Value;

您可能还想使用 Regex.Matches(...)而不是 Regex.Match(...)

关于c# - 提取链接正则表达式 c#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6313033/

相关文章:

在 react 形式上使用正则表达式进行 Angular 7 电子邮件验证

python - pandas' `str.extract()` 中带有捕获组的正则表达式的预期行为

perl - 为什么行终止符 `\r\n` 导致组不匹配?

python - 正则表达式 - 如何匹配特定长度的一组唯一字符

c# - 在图像中搜索颜色范围

c# - Json 没有以所需的模式返回正确的值

c# - 如何在不装箱的情况下检索枚举的哈希码?

c# - CodeContracts 错误地标记了基础构造函数中已经存在的缺失前提条件

python - Python 正则表达式中的 "(?&lt;!…)"符号是什么意思?

regex - nifi route文本处理器使用问题