我正在尝试从此网站提取数据( Logo 图像、名称、位置等):https://websummit.com/startups/featured-startups?q=eyJwYWdlIjoxLCJjb25maWd1cmUiOnsiaGl0c1BlclBhZ2UiOjQ4LCJ0YWdGaWx0ZXJzIjpbIndzMjEiXX19
问题是,当单击图像时,会出现一个可视弹出窗口(网址不会更改),因此我尝试了各种选择器(我使用的站点地图示例:主页>>弹出选择器(带有多个选项)>>名称、位置等的文本选择器),但它们都不起作用(我可以看到数据,但抓取后没有可用数据)
有人可以告诉我站点地图有什么问题或者使用什么选择器来访问可视弹出窗口中的数据吗?
最佳答案
我没有使用选择器按钮,而是使用了弹出链接选择器以及从页面中提取的 CSS,然后选择了多个复选框
ID Selector type Multiple Parent selectors Actions
startup-logo .MuiPaper-root.MuiCard-root.jss51.MuiPaper-elevation1.MuiPaper-rounded SelectorPopupLink yes _root
我还创建了以下子选择器
ID Selector type Multiple Parent selectors Actions
startup-name span.jss53 SelectorText no startup-logo
这种方法对我来说适用于所有其他选择器,但不适用于 PopupLink, 这让我相信弹出链接选择器已损坏。
多个页面证实了这一点,称该插件 returns no data .
所以本质上,停止使用这个插件并使用其他替代品。 以下是我所知道的一些:
- DataScraper
- Octoparse - 有免费试用选项
- Parsehub - 有免费试用
或者,如果您愿意进行一些编程,请查看 selenium因为它是收集数据的终极工具。
关于html - 如何从 Chrome 网络抓取插件的可视弹出窗口中提取数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69303751/