html-parsing - 使用 Go lang 从网页中提取链接

标签 html-parsing go

我在学习google's Go programming language .有谁知道从 html 网页中提取所有 URL 的最佳做法?

来自 Java 世界,有一些库可以完成这项工作,例如 jsoup , htmlparser等。但是对于 go lang,我想还没有可用的类似库吗?

最佳答案

如果你了解 jQuery,你会爱上 GoQuery .

老实说,它是我在 Go 中找到的最简单、最强大的 HTML 实用程序,它基于 go.net 存储库中的 html 包。 (好吧,所以它比解析器更高级,因为它不公开原始 HTML token 等,但如果你想用 HTML 文档实际完成任何事情,这个包会有所帮助。)

关于html-parsing - 使用 Go lang 从网页中提取链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11080936/

相关文章:

javascript - 如何从 Beautiful Soup 获取 URL?

html - 用于验证 HTML 标记之间内容的正则表达式

html - 如果不使用正则表达式,HTML 解析如何工作?

csv - 解析csv文件时出现奇怪的输出

html - 在 Go 中从 html 页面中提取文本

macos - golang 工具 pprof 无法正常工作 - 无论分析目标如何,输出都相同

html-parsing - 简单的 HTML Dom 解析器 : How to insert to elements

python - BeautifulSoup 获得标签.id

go - 鸭子打字 : How to implicitly convert from an interface to another interface in go

session - golang martini session.Set 不设置任何值