python - 由于OSError无法运行python beautifulsoup Web抓取程序

标签 python web-scraping beautifulsoup error-handling selenium-chromedriver

我正在尝试通过网络抓取Instagram帐户,但出现错误:

Traceback (most recent call last):
  File "C:/Users/User/Desktop/python/webscraper.py", line 11, in <module>
    browser = webdriver.Chrome(r"C:\Users\User\Downloads\chromedriver_win32.zip")
  File "C:\Users\User\AppData\Local\Programs\Python\Python38-32\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 73, in __init__
    self.service.start()
  File "C:\Users\User\AppData\Local\Programs\Python\Python38-32\lib\site-packages\selenium\webdriver\common\service.py", line 72, in start
    self.process = subprocess.Popen(cmd, env=self.env,
  File "C:\Users\User\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 854, in __init__
    self._execute_child(args, executable, preexec_fn, close_fds,
  File "C:\Users\User\AppData\Local\Programs\Python\Python38-32\lib\subprocess.py", line 1307, in _execute_child
    hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
OSError: [WinError 193] %1 is not a valid Win32 application
我正在尝试运行以下代码:
from selenium import webdriver
from bs4 import BeautifulSoup as bs
import time
import re
from urllib.request import urlopen
import json
from pandas.io.json import json_normalize
import pandas as pd, numpy as np

username='dailydogsnapz'
browser = webdriver.Chrome(r"C:\Users\User\Downloads\chromedriver_win32.zip")
browser.get('https://www.instagram.com/'+username+'/?hl=en')
Pagelength = browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
我不明白我在做什么错。我尝试查找此错误,但是GitHub上的解决方案或其他堆栈溢出问题都无法解决该问题。

最佳答案

问题:

browser = webdriver.Chrome(r"C:\Users\User\Downloads\chromedriver_win32.zip")
您指向的是.zip文件,而不是chrome驱动程序的可执行文件。您需要解压缩该文件,然后指向该可执行文件。
解:
将文件解压缩到同一位置后,您可以执行以下操作:
browser = webdriver.Chrome(r"C:\Users\User\Downloads\chromedriver_win32.exe")
请注意,从.zip更改为.exe意味着可执行文件。

关于python - 由于OSError无法运行python beautifulsoup Web抓取程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62823131/

相关文章:

javascript - 动态文本抓取

python - 如何使用 Beautiful Soup 到 &lt;script&gt; 标签?

python - 如何在网页抓取时使用 FindAll

python - 当值为0时如何在轴上显示条形类别

python - Django .only() 导致最大递归深度超出错误?

python - 如何计算 odoo 13 销售订单行上的字段?

python - 使用 enumerate 遍历列表字典以提取信息

python - 在 python 脚本中将参数传递给 scrapy spider

python - Selenium webdriver 从 find_elements_by_X 返回空列表

python - 使用 Python 3 从动态 HTML 表中提取数据