我在学习google's Go programming language .有谁知道从 html 网页中提取所有 URL 的最佳做法?
来自 Java 世界,有一些库可以完成这项工作,例如 jsoup , htmlparser等。但是对于 go lang,我想还没有可用的类似库吗?
最佳答案
如果你了解 jQuery,你会爱上 GoQuery .
老实说,它是我在 Go 中找到的最简单、最强大的 HTML 实用程序,它基于 go.net 存储库中的 html 包。 (好吧,所以它比解析器更高级,因为它不公开原始 HTML token 等,但如果你想用 HTML 文档实际完成任何事情,这个包会有所帮助。)
关于html-parsing - 使用 Go lang 从网页中提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11080936/