c++ - 如何使用 C++ 从 HTML 中提取文本?

标签 c++ html

如何使用 C++ 解析 HTML 标签?

例如:

<html><body>examlpe text </body></html>

最佳答案

最简单的选择是使用 HTML 解析库。 libxml2是一个可靠的开源库,尽管从技术上讲它是一个 C 库。您需要加载您的 html,然后遍历 DOM 以拉出所有 text() 节点。我不知道我是否会推荐它作为您的第一个 C++ 任务。

关于c++ - 如何使用 C++ 从 HTML 中提取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3605592/

相关文章:

python - django-使文件字段可选时出错

c++ - C++/WinRT 到底是什么?

c++ - 隐藏 typedef 实现

c++ - 如何加载 cedet、语义等。 al 仅当 .cxx,.h .cpp 文件打开时

c++ - std::vector<type> 的类型要求

javascript - 使用 Javascript/jQuery 插入带有类的 HTML

C++ 字符串数组,从文件中加载文本行

jquery - 使用 jQuery 隐藏/显示后在 IE 中不可点击/可选择/可聚焦的元素

java - 显示隐藏字段的 validator 消息

javascript - 将 DOM 树不同部分的元素显示在另一个元素旁边