c++ - 如何在 Linux 中使用 C++ 库读取 html?

标签 c++ html linux

是否有任何 C++ 库可用于在 Linux 中读取 HTML?

最佳答案

如果你有损坏的 HTML 需要修复,libcurl 是你的 friend + 整洁(HTML 整洁)。

编辑:这是完整的序列

HTML(在文件中)-> tidy(这将清理格式错误的 HTML)-> XSLT 转换(您需要提供一个 XSL 文件来将您的 HTML 转换为 Latex),并使用 libxml/libxsl(http://xmlsoft.org/) -> 然后使用 latex 处理 latex 文档(通过 fork out to latex 命令)或者如果你愿意,你可以下载 lyx 的源代码并看看他们是如何做到的(http://www .lyx.org/)。不幸的是,这个序列太复杂了,无法写成一个例子,我只能给你序列...

关于c++ - 如何在 Linux 中使用 C++ 库读取 html?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4025498/

相关文章:

javascript - 使用带有 setDragImage 的 Sprite 图像

html - chrome 错误显示 flex 宽度 100

linux - GNU screen : set name or title

c++ - C中的编译时错误

c++ - 从 std::stoi 获取基数

c++ - std::list 提示缺少第二个模板参数(分配器)

c++ - 从dat文件读入数组

javascript - Uncaught Error : Parse Error: Line 13: Unexpected identifier

mysql - 从 bash 脚本查询 MySQL 数据库

c++ - 是否在类外重新声明一个 const 静态变量