我已经使用 .NET 将 HTML 文档加载到字符串中。我有这个 REGEX,我可以用它来匹配 URL 并替换它们,但我只需要匹配 ONLY NOT 完全限定的 URL。
如果这是我的字符串:
djdjdjdjdjdj src="www.example.com/images/x.gif" dkkdkdkdk src="/images/x.gif
我的结果应该是这样的:
djdjdjdjdjdj src="subdomain.example.com/images/x.gif" dkkdkdkdk src="http://www.example.com/images/x.gif
我的想法是我需要一个 REGEX 来匹配以 src
或 href
开头且句点不超过一个的字符串。此正则表达式匹配至少有一个句点的链接,因此无法正确匹配它们。
(src|href)\=(\"(.+?)[\.](.+?)\")
感谢您提供任何信息。我在 C# 中对此进行编码,但只需要 REGEX
最佳答案
我建议您尝试使用 HTML Agility 解析器之类的东西,正如本网站多次推荐的那样:Looking for C# HTML parser
阅读此 obscure blog entry 也无妨在你开始之前由一些 Metallica 粉丝。
关于c# - 如果字符串没有超过一个句点,则匹配正则表达式。匹配非完全限定的 URL 路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2006336/