html - 如何从 Chrome 网络抓取插件的可视弹出窗口中提取数据?

标签 html web-scraping google-chrome-extension selectors-api

我正在尝试从此网站提取数据( Logo 图像、名称、位置等):https://websummit.com/startups/featured-startups?q=eyJwYWdlIjoxLCJjb25maWd1cmUiOnsiaGl0c1BlclBhZ2UiOjQ4LCJ0YWdGaWx0ZXJzIjpbIndzMjEiXX19

问题是,当单击图像时,会出现一个可视弹出窗口(网址不会更改),因此我尝试了各种选择器(我使用的站点地图示例:主页>>弹出选择器(带有多个选项)>>名称、位置等的文本选择器),但它们都不起作用(我可以看到数据,但抓取后没有可用数据)

有人可以告诉我站点地图有什么问题或者使用什么选择器来访问可视弹出窗口中的数据吗?

最佳答案

我没有使用选择器按钮,而是使用了弹出链接选择器以及从页面中提取的 CSS,然后选择了多个复选框

ID  Selector    type    Multiple    Parent selectors    Actions
startup-logo    .MuiPaper-root.MuiCard-root.jss51.MuiPaper-elevation1.MuiPaper-rounded  SelectorPopupLink   yes _root   

enter image description here

我还创建了以下子选择器

ID  Selector    type    Multiple    Parent selectors    Actions
startup-name    span.jss53  SelectorText    no  startup-logo    

enter image description here

enter image description here

这种方法对我来说适用于所有其他选择器,但不适用于 PopupLink, 这让我相信弹出链接选择器已损坏。

多个页面证实了这一点,称该插件 returns no data .

所以本质上,停止使用这个插件并使用其他替代品。 以下是我所知道的一些:

或者,如果您愿意进行一些编程,请查看 selenium因为它是收集数据的终极工具。

关于html - 如何从 Chrome 网络抓取插件的可视弹出窗口中提取数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69303751/

相关文章:

javascript - 克隆范围不起作用

javascript - 如何使用 jQuery 只允许文本区域中的数字?

javascript - 当文本在里面时,jquery animate 导致 div 为 'jump'

python - 使用 Python 抓取 Google - requests.get 的正确 URL 是什么?

javascript - "content_scripts"无法在 Chrome v38+ 中工作?

html - 如何在 <th> 元素上使用 nowrap 水平滚动表格而不溢出到下一列?

excel - 使用 VBA 和 IE 解析 Internet HTML 页面的数据

html - 使用css选择器excel vba从网站抓取数据

linux - 清除 Google Secure Shell 中的终端屏幕

javascript - 如何使用 chrome 扩展程序在网页中注入(inject)模板组件?