我正在尝试列出在网页中找到的所有标记。核心在功能
func find_links(httpBody io.Reader) []string {
links := make([]string, 0)
page := html.NewTokenizer(httpBody)
for {
tokenType := page.Next()
if tokenType == html.ErrorToken {
return links
}
token := page.Token()
fmt.Println("Now token is ", token)
}
}
当我打印输出时,我得到类似的东西
Now token is <body>
Now token is
Now token is <header>
我不明白第二个标记是什么以及为什么要打印一个额外的空行。
工作示例的完整代码 here , 即使它因为缺少 http 包而不能在 playground 上运行
最佳答案
关于html - 来自 html.NewTokenizer.Token() 的意外 HTML 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26132041/