我想使用名为 source.html
或 source.txt
的源文件中的正则表达式:
<OPTION value=5> 5 - Course Alpha (3)</OPTION> <OPTION value=6> 6 - Course Beta (3)</OPTION>
获取:
5 - Course Alpha (3)
6 - Course Beta (3)
我的意思是我必须找到一种模式:
<OPTION v
和
finding first number after it
所以得到一切,直到我看到:
</OPTION>
如何使用正则表达式通过 Perl 实现它?
PS:它应该从文件中读取内容并将输出写入文件。
最佳答案
您不想使用正则表达式,您想使用 HTML 解析器。这是 good article on the subject这解释了为什么正则表达式很脆弱以及如何使用 HTML::TreeBuilder .
还有a small pile of similar questions and answers关于从 HTML 文档中提取数据。
关于html - Perl 正则表达式模式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5650376/