我正在尝试为我的 html 解析器编写一个正则表达式。
我想用包含一个或多个 <div>
的给定属性(例如 class="tab news selected"
和 <a href>
)匹配一个 html 标签标签。正则表达式应匹配整个标签(从 <div>
到 </div>
)。我似乎总是遇到“内存耗尽”错误 - 我的程序可能会将它能找到的每个标签都作为匹配标签。
我正在使用 boost 正则表达式库。
最佳答案
你应该看看 this question关于。正则表达式和 HTML。要点是,使用正则表达式来解析 HTML 绝不是一个理想的解决方案。
关于c++ - 如何编写用于html解析的正则表达式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/792679/