javascript - Scrapy 中的 Selenium + PhantomJS

标签 javascript python selenium scrapy phantomjs

我正在尝试使用 Selenium 和 PhantomJS 来获取网站的动态内容。这是我的代码

class judge(Spider):
    name = "judge"
    start_urls = ["http://wenshu.court.gov.cn/List/List?sorttype=1&conditions=searchWord+2+AJLX++%E6%A1%88%E4%BB%B6%E7%B1%BB%E5%9E%8B:%E6%B0%91%E4%BA%8B%E6%A1%88%E4%BB%B6"]

    def init_driver(self):
        driver = webdriver.Chrome()
        return driver 

    def parse(self,response):
        driver = self.init_driver()
        driver.get(self.start_urls[0])
        sel = Selector(text=driver.page_source)
        self.logger.info(u'---------------Parsing----------------')
        print sel.xpath("//div[@class='dataItem'][1]/table/tbody/tr[1]/td/div[@class='wstitle']/a/text()").extract()
        self.logger.info(u'---------------success----------------')

当我使用 driver = webdriver.Chrome() 尝试我的脚本时,sel.xpath("//div[@class='dataItem'] 给出了所需的内容,并且一切正常。但是当我改为使用 driver = webdriver.PhantomJS() 时,sel.xpath("//div[@class='dataItem'] 为空。我尝试在 driver. get() 使页面完全加载,但不起作用。

最佳答案

你可以尝试这个:

driver = webdriver.PhantomJS('add your directory of phantomjs here')

关于javascript - Scrapy 中的 Selenium + PhantomJS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37959829/

相关文章:

python - 使用 wxglade 创建的 "custom"对话框中的确定/取消订单

javascript - 如何使用innerHTML显示多个输出?

javascript - 计算循环执行了多少次

python - 如何获取 Distutils compile() 函数使用的实际命令?

python - 如何在 Xvfb 中运行 Selenium?

java - selenium 的自定义 JAVA 位置

python - 在 Python 上使用 Selenium 来操作 Tor。由于未知原因不起作用

javascript - 来自 CoderSchool 的 JavaScript 中的闭包

javascript - Bootstrap DateTime Picker禁用过去时间

javascript - 通过 flask 将谷歌图表的列表信息正确发送到 JS?