Golang Web Crawler解决方案，2个数据竞争，退出状态66

我一直在关注这个solution .当我运行竞争检测器时没有检测到竞争条件。但是当我用我的代码运行 race detecter 时，它给出了以下错误:

================== WARNING: DATA RACE Read at 0x00c42006c1e0 by goroutine 6: main.Crawl.func1() /task2.go:50 +0x53

Previous write at 0x00c42006c1e0 by main goroutine: main.Crawl() /task2.go:48 +0x692 main.main() /task2.go:66 +0x8c

Goroutine 6 (running) created at: main.Crawl() /task2.go:49 +0x61e main.main() /task2.go:66 +0x8c ================== . . . ================== WARNING: DATA RACE Read at 0x00c420094070 by goroutine 8: main.Crawl.func1() /task2.go:50 +0x53

Previous write at 0x00c420094070 by goroutine 6: main.Crawl() /task2.go:48 +0x692 main.Crawl.func1() /task2.go:51 +0x240

Goroutine 8 (running) created at: main.Crawl() /task2.go:49 +0x61e main.Crawl.func1() /task2.go:51 +0x240

Goroutine 6 (running) created at: main.Crawl() /task2.go:49 +0x61e main.main()

/task2.go:66 +0x8c

Found 2 data race(s) exit status 66

以下是我的代码，谁能告诉我哪里出错了。我一直想弄明白这么久，但无法确定。

        var visited = struct {
        urls map[string]bool
        sync.Mutex
    }{urls: make(map[string]bool)}

    func Crawl(url string, depth int, fetcher Fetcher) {

        if depth <= 0 {
            return
        }

        visited.Lock()
        if visited.urls[url] && visited.urls[url] == true {
            fmt.Println("already fetched: ", url)

            visited.Unlock()
            return
        }
        visited.urls[url] = true
        visited.Unlock()

        body, urls, err := fetcher.Fetch(url)

        if err != nil {
            fmt.Println(err)
            return
        }
        done := make(chan bool)

        for _, nestedUrl := range urls {
            go func(url string, d int) {
                fmt.Printf("-> Crawling child %v of %v with depth %v \n", nestedUrl, url, depth)
                Crawl(url, d, fetcher)
                done <- true

            }(nestedUrl, depth-1)
        }
        for i := range urls {
            fmt.Printf("<- [%v] %v/%v Waiting for child %v.\n", url, i, len(urls))
            <-done
        }
        fmt.Printf("<- Done with %v\n", url)
    }

    func main() {
        Crawl("http://golang.org/", 4, fetcher)

        fmt.Println("Fetching stats\n--------------")

        for url, err := range visited.urls {
            if err != true {
                fmt.Printf("%v failed: %v\n", url, err)
            } else {
                fmt.Printf("%v was fetched\n", url)
            }
        }
  }

最佳答案

您正在调用 Crawl，它会触发一个 go 例程进行递归，然后您正在访问 protected 映射，而 main 中没有互斥体，它在一些爬行完成之前执行。关于风格的几点:

更喜欢同步 api
将被访问的结构负责锁定(无公共(public)锁)
在 main 中使用 WaitGroup 或 channel 等待完成

所以开始同步，然后弄清楚如何最好地更改为异步。然后，您只需将 go 放在同步爬网功能前面即可使其同步。查看原始游览，它与此解决方案不太相似，因此我不确定这是一个值得遵循的好模型。调用者不必锁定或担心竞争，因此您需要重新设计。我将从 original tour exercise 重新开始.

对于锁，我会使用

type T struct {
data map[string]bool
mu sync.Mutex // not just sync.Mutex
}

T 决定何时需要锁定，并具有调整数据状态或搜索数据的功能。这使得考虑使用 Lock 变得更简单，并且不太可能出错。

关于Golang Web Crawler解决方案，2个数据竞争，退出状态66，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46749498/

Golang Web Crawler解决方案，2个数据竞争，退出状态66

/task2.go:66 +0x8c

上一篇：amazon-web-services - Golang 在 AWS 中重定向到 HTTPS

下一篇：networking - 如何在 Go 中获取继承结构的属性？