javascript - 使用影子根来隐藏爬虫数据

标签 javascript html web-scraping web-crawler web-component

影子根是否总是可以从与根本身相同的窗口/框架/页面中的任何 JavaScript 上下文访问?

如果是,则无法通过将数据放入影子根来隐藏网络抓取工具中的数据。

如果它并不总是可访问的(例如,如果存在某种奇怪的“跨源”安全策略),则某些元素的影子根中渲染的(用户可见)但不是逻辑 DOM 内容可能无法访问该页面上的 javascript 上下文 - 因此允许该数据对(非极端 OCR)抓取工具隐藏。

由于我从事数据抓取业务,我希望是前者!

最佳答案

规范是这样说的:

To facilitate invoking callbacks, each unit of related similar-origin browsing contexts has a processing stack, which is initially empty. Each item in the stack is an element queue, which is initially empty as well. Each item in the element queue is a custom element.

如果您想隐藏数据,这里有两个选项:

引用文献

关于javascript - 使用影子根来隐藏爬虫数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22825604/

相关文章:

html - Bootstrap 网格 [2 项] 在中心

html - 对齐图像右侧的文本,并在容器中向左浮动

javascript - TD :nth-of-type ('+element+' ) not working in casperjs

Javascript 排列魔术

javascript - Three.js - 使用 ShaderMaterial、TangentSpace 和 fromGeometry 进行法线贴图

javascript - 使用 JavaScript 将参数添加到 url

html - 移动到选项卡和该选项卡内的特定位置

python - 使用 Selenium Python 进行网页抓取 [Twitter + Instagram]

python - 使用西类牙凉菜汤和 Pandas 刮取时产量有限

javascript - 有什么方法可以查看使用浏览器(chrome 或 firefox)加载 .js 的顺序?