html - 如何修改正则表达式以删除所有后跟 CR 或 LF 的字符串

标签 html regex notepad++

我想从 Hot Bird 13.0E 卫星转发器的一列频率中获取 html
链接在这里:http://pl.kingofsat.net/pos-13E.php

这个保存的html页面很大,有几千行,很难以模式呈现。更简单的方法是从中提取简短内容。


这是演示链接:
https://regex101.com/r/9k9NGA/2

在 Notepad++ 中

- Ctrl+H
- 查找内容:.*(\d{5}\.\d{2}).* 定义的频率
*-替换为:$1
*- 勾选环绕
*- 检查正则表达式
*- 全部替换

部分代码如下:

"basc_tp('m0')"><span class="nbc">11</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">bbhg 10719.25</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld"<td class="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im1" style="cursor: pointer" onclick="basc_tp('m1')"><span class="nbc">3</span><a class="bld">Hot Bird 13B</a></td> <td width="7%" class="bld"> 10727.00</td><td width="2%" class="bld">H</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=225">111</a></td><td class="w3-hide-small" width="10%"><a class="bld" href="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im2" style="cursor: pointer" onclick="basc_tp('m2')"><span class="nbc">30</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld"> 10758.00</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=5059">112</a></td><td class="w3-hide-small" width="10%"><a class="bld" href=="cursor: pointer" onclick="basc_tp('m3')"><span class="nbc">19</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld"> 10775.00</td><td width="2%" class="bld">H</td><td class="w3-hide-small" width="3%"><a class="bld" href="tp.php?tp=227">113</a></td><td class="w3-hide-small" width="10%"><a class="bld" href=></table><div class="frqb"></div></div> <table class="frq"><tr bgcolor="#D2D2D2"> <td class="pos" dir="ltr">13.0&deg;E</td> <td width="20%"><img src="/action_collapse.gif" id="im10" style="cursor: pointer" onclick="basc_tp('m10')"><span class="nbc">16</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld"> 10911.00</td><td width="2%" class="bld">V</td><td class="w3-hide-small" width="3%"><a class="bld"

以下是部分代码:

"basc_tp('m0')"><span class="nbc">11</span><a class="bld">Hot Bird 13C</a></td> <td width="7%" class="bld">bbhg 10719.25 10727.00 10758.00 10775.00 10911.00
在表达式的顺序中应该添加或更改什么:
.*(\d{5}\.\d{2}).* 它还将包含空白字符(后视)(CR 和 LF)以进行进一步的操作。 当代码中出现“.*”后面的字符LF或CR时,出现LF或CR时不包括前面的所有字符和标记,并且前2行没有删除,为什么?

最佳答案

您可以使用一步法获取您的值(value)观列表:

(\d{5}\.\d{2})|(?s:.)

替换为

(?1$1\n:)

正则表达式模式匹配并捕获到第 1 组的五位数字、点和两位数字,或者只匹配任何字符。替换模式是一个条件,如果第 1 组匹配,则用第 1 组和换行符替换找到的匹配项,或者用空字符串(如果匹配任何其他字符)。请注意,如果您选择 . matches newline 选项,则 (?:) 可能会被删除。

关于html - 如何修改正则表达式以删除所有后跟 CR 或 LF 的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47598330/

相关文章:

regex - perl6 需要帮助以了解有关 proto regex/token/rule 的更多信息

Notepad++ 颜色突出显示及其值

windows-7 - 无法编辑主机文件

android - HTML5 地理定位在 Android 模拟器中不起作用

jquery - 数据表 - 在页面加载时,表格布局不会立即加载

html - 构建与 IE8 兼容的可调整大小的图形/图表时出现问题

notepad++ - 更改打开的文本文件的名称

html - Firefox 强制文本在同一行

php - 删除除特定文本和值正则表达式之外的所有文本

java - 用带有斜杠的字符串变量替换硬编码字符串