是否有任何 C++ 库可用于在 Linux 中读取 HTML?
最佳答案
如果你有损坏的 HTML 需要修复,libcurl 是你的 friend + 整洁(HTML 整洁)。
编辑:这是完整的序列
HTML(在文件中)-> tidy(这将清理格式错误的 HTML)-> XSLT 转换(您需要提供一个 XSL 文件来将您的 HTML 转换为 Latex),并使用 libxml/libxsl(http://xmlsoft.org/) -> 然后使用 latex 处理 latex 文档(通过 fork out to latex 命令)或者如果你愿意,你可以下载 lyx 的源代码并看看他们是如何做到的(http://www .lyx.org/)。不幸的是,这个序列太复杂了,无法写成一个例子,我只能给你序列...
关于c++ - 如何在 Linux 中使用 C++ 库读取 html?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4025498/