假设我下载了一个 html 页面及其所有 css 文件(例如,使用 curl) 所以我有一些 html 代码,头部、标签中的一些 css,以及文件中的一些 css。
有没有我可以使用的工具,例如获取页面中位置 2957 处该字符的颜色和字体大小,或该标签从位置 3917 开始的高度?
我正在寻找不带 X 的 Linux 命令行或 perl 模块。 当然,该工具会知道 parent 的礼节是如何产生的,如何根据他们的顺序被 css 代码覆盖,等等。
谢谢!
编辑:高度是一个危险的例子,会让读者感到困惑。我不是指自动时的渲染高度,例如我的意思是字符串“自动”。因此无需渲染。
最佳答案
标准的 headless 浏览器是 PhantomJS:http://phantomjs.org/ (还有其他类似的类似 https://slimerjs.org/ )。
我不确定它的像素完美程度如何(但即使在混合操作系统等上使用不同版本的桌面浏览器也是如此),但会进行完整的 DOM 和 CSS 解析,您可以编写脚本和从中获取结果。
关于html - 解释 HTML/CSS 和获取元素样式的命令行工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38318667/