html - Powershell正则表达式匹配除第一个以外的字符串

我有以下 html 模式。

href="{{url}}" class="item-name prdctNm">{{name}}</a><div>
href="/drugs/sporanox-100-mg-33294" class="item-name prdctNm">Sporanox (100 Mg)</a>
href="/drugs/sporan-200-mg-34240" class="item-name prdctNm">Sporan (200 Mg)</a>
href="/drugs/spornid-500-mg-25051" class="item-name prdctNm">Spornid (500 Mg)</a>

我想要的是获取像这样的产品名称

Sporanox (100mg), Sporan (200 mg) and Spornid (50mg).

Updated Solution

** :它几乎匹配整个页面。从 first instance of 开始"item-name prdctNm"至 last <\a>在页面上 - 它匹配介于两者之间的所有内容。但是，我需要匹配 text between "item-name prdctNm" and tag <\a>旁边。

现在它完美运行了:

$regex = [RegEx]'"item-name prdctNm"(.[^{}<>]*)</a>'
$url = ‘https://www.xxx.com/search/all?name=sporanox’
$wc = New-Object System.Net.WebClient
$content = $wc.DownloadString($url)
$regex.Matches($content) | ForEach-Object { $_.Groups[1].Value }

最佳答案

使用下面的正则表达式，然后在最后打印组索引 1，其中 Groups[0] 包含整个匹配项，Groups[1] 包含匹配的字符被第一组捕获。

$regex = [RegEx]'"item-name prdctNm">([^}{<>]*)</a>'
$url = ‘https://www.xxx.com/search/all?name=sporanox’
$wc = New-Object System.Net.WebClient
$content = $wc.DownloadString($url)
$regex.Matches($content) | ForEach-Object { $_.Groups[1].Value }

关于html - Powershell正则表达式匹配除第一个以外的字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27457951/

上一篇：jQuery 追加 li 无法删除

下一篇：html - 如何将 html 元素的高度设置为 { 100% - 10em from bottom }

c++ - 使用 std::regex 过滤输入

java - 从命令行读取时将空元素插入到 ArrayList 中

regex - 如何使用正则表达式和 Powershell 提取字符串 "Task(12345)"中的数字？

powershell - Get-InstalledModule 和 Get-Module -ListAvailable 有什么区别？

javascript - 拖放元素定位

PHP 表单发布到 MySQL 错误

regex - 匹配正则表达式并在单行代码中分配结果

windows - "rm -rf"等同于 Windows PowerShell？

css - 在页面中间/中心对齐文本，在底部/中心对齐按钮