c# - 使用 Lookahead 使用正则表达式匹配字符串

标签 c# html regex

我需要使用正则表达式来匹配一个字符串 holiding html 以拉出所有嵌套的跨度,我假设我假设有一种方法可以使用正则表达式来执行此操作,但整个上午都没有成功。

所以对于示例输入字符串

<DIV id=c445c9c2-a02e-4cec-b254-c134adfa4192 style="BORDER-RIGHT: #000000 1px solid; BORDER-TOP: #000000 1px solid; BORDER-LEFT: #000000 1px solid; BORDER-BOTTOM: #000000 1px solid; BACKGROUND-COLOR: #eeeeee">
<SPAN id=b8db8cd1-f600-448f-be26-2aa56ea09a9c>
<SPAN id=304ccd38-8161-4def-a557-1a048c963df4>
<IMG src="http://avis.co.uk/Assets/build/menu.gif">
</SPAN>
</SPAN>
<SPAN id=bc88c866-5370-4c72-990b-06fbe22038d5>
<SPAN id=55b88bbe-15ca-49c9-ad96-cecc6ca7004e>UK<BR></SPAN>
</SPAN>
<SPAN id=52bb62ca-8f0a-42f1-a13b-9b263225ff1d>
<SPAN id=0e1c3eb6-046d-4f07-96c1-d1ac099d5f1c>
<IMG src="http://avis.co.uk/Assets/build/menu.gif">
</SPAN>
</SPAN>
<SPAN id=4c29eef2-cd77-4d33-9828-e442685a25cb>
<SPAN id=0d5a266a-14ae-4a89-9263-9e0ab57f7ad2>Italy</SPAN>
</SPAN>
<SPAN id=f0a72eea-fddd-471e-89e6-56e9b9efbece>
<SPAN id=b7d9ada7-ade0-49fe-aa5f-270237e87c2b>
<IMG src="http://avis.co.uk/Assets/build/menu.gif">
</SPAN>
</SPAN>
<SPAN id=7604df94-34ba-4c89-bf11-125df01731ff>
<SPAN id=330d6429-4f1b-46a2-a485-9001e2c6b8c1>Netherlands</SPAN>
</SPAN>
<SPAN id=a18fb516-451e-4c32-ab31-3e3be29235f6>
<SPAN id=6c70238d-78f9-468f-bb8d-370fff13c909>
<IMG src="http://avis.co.uk/Assets/build/menu.gif">
</SPAN>
</SPAN>
<SPAN id=5a2465eb-b337-4f94-a4f8-6f5001dfbd75>
<SPAN id=47877a9e-a7d5-4f13-a41e-6948f899e385>Malta &amp; Gozo

我想得到每个外部跨度及其包含的跨度,所以在上面的文本中应该有八个结果

欣然接受任何帮助

最佳答案

再次use an HTML parser遍历 DOM:正则表达式永远无法做到这一点。

关于c# - 使用 Lookahead 使用正则表达式匹配字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/352354/

相关文章:

javascript - 在可变高度网格行中处理@material-ui骨架缩放的好方法?

javascript - 我们如何从 jQuery Dialog 传递参数并更改 html 的内容?

Ruby RegExp - 匹配所有 CSS 选择器和指令

C# - 在 Foreach 循环中重用变量

c# - 是否可以使 FolderBrowserDialog 的默认路径显示在库中而不是实际磁盘中?

c# - SharePoint GetListItems - 获取所有列,按集列表 ID 过滤。 C#

JavaScript、HTML : Loop placeholder name with multiple values

regex - 如何否定反向引用正则表达式

java - 正则表达式匹配器未给出预期结果。号码不正确匹配

c# - 循环遍历目录