我正在尝试创建要访问的 URL 的 visit_urls
列表。
起初我手动指定第一个 url 访问 self.br.get(url)
并检查该页面的页数,例如它有 40 页,我会用“count”知道它,我只想用 &page=2 &page=3 切换 url 的末尾,最多 40 页.
这是我的代码的循环部分。我只需要一种方法将所有页面添加到 visit_urls
列表
visit_urls=[]
self.br.get(url)
count = self.br.find_elements_by_xpath("//*[@class='count']").get_attribute("innerHTML"):
for (here up to count)
self.visit_urls.append(url + need to append this also to the end of the first url &page=2-count)
这段代码是经过大量研究后得出的,我被卡住了,所以任何帮助都会很棒!
最佳答案
尝试这样的事情:
visit_urls=[]
self.br.get(url)
count = self.br.find_elements_by_xpath("//*[@class='count']").get_attribute("innerHTML")
for page_number in xrange(1, count+1):
url = '{url}&page={page_number}'.format(url=url, page_number=page_number)
visit_urls.append(url)
这将在假设 url
永远不变的情况下工作。也就是说,如果 url
变量始终指向相同的 url,您最终会得到类似 http://www.mysite.com&page=1&page=2&page=3
的 url
确保 url 始终被正确定义。
关于python - 循环并添加到列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20081005/