ruby - 如何编写使用 chrome 的 ruby​​ 网络爬虫?

标签 ruby google-chrome selenium watir-webdriver selenium-chromedriver

我有一个 ruby​​ 网络爬虫,目前编码为在 firefox 中运行。我该如何将其切换到 Chrome?

def open_browser()
  tweaked_profile = Selenium::WebDriver::Firefox::Profile.new
  tweaked_profile['nglayout.initialpaint.delay'] = 0
  tweaked_profile.assume_untrusted_certificate_issuer=false
  tweaked_profile['permissions.default.image'] = 2
  tweaked_profile['network.proxy.type'] = 1
  tweaked_profile['network.proxy.http'] = 'ec2proxy.csnzoo.com'
  tweaked_profile['network.proxy.http_port'] = 8080
  driver = Selenium::WebDriver.for :firefox, :profile => tweaked_profile
  $browser = Watir::Browser.new(driver)
end

我应该放弃 watir 并使用 chromedriver 还是 watir 会为此工作?

最佳答案

查看 http://watirwebdriver.com/chrome/ ,其中有这个例子:

profile = Selenium::WebDriver::Chrome::Profile.new
... 
b = Watir::Browser.new :chrome, :profile => profile

此外,这些 SO 问题还提供了抓取网站的替代方法:Web crawler in rubyWhat are some good Ruby-based web crawlers?

关于ruby - 如何编写使用 chrome 的 ruby​​ 网络爬虫?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16068267/

相关文章:

jquery - 具有可调整大小/可拖动元素的响应式 jQuery UI

selenium - 在 Selenium RC 中模拟 TAB 按键事件

ruby-on-rails - 如何在 Ajax 请求处理期间显示动画图标 - Rails 3

ruby-on-rails - 如何通过自定义方法对表格进行排序

javascript - Web 应用程序在 Chrome 中放大

java - 如何执行eclipse的任务计划程序?

java - 无法使测试方法与 Selenium 网格并行运行

ruby-on-rails - 在没有 att_accessor 的情况下选择不在模型中的属性

ruby - 有没有更好的方法来获取 Ruby 对象的公共(public) "properties"?

javascript - 通过 chrome 浏览器扩展调用 C dll