html-parsing - 使用 Go lang 从网页中提取链接

我在学习google's Go programming language .有谁知道从 html 网页中提取所有 URL 的最佳做法？

来自 Java 世界，有一些库可以完成这项工作，例如 jsoup , htmlparser等。但是对于 go lang，我想还没有可用的类似库吗？

最佳答案

如果你了解 jQuery，你会爱上 GoQuery .

老实说，它是我在 Go 中找到的最简单、最强大的 HTML 实用程序，它基于 go.net 存储库中的 html 包。 (好吧，所以它比解析器更高级，因为它不公开原始 HTML token 等，但如果你想用 HTML 文档实际完成任何事情，这个包会有所帮助。)

关于html-parsing - 使用 Go lang 从网页中提取链接，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11080936/

相关文章：

javascript - 如何从 Beautiful Soup 获取 URL？