bash - 从 Linux 终端获取网页标题、图像、元数据信息

标签 bash html sh

有什么方法或任何工具可以用来从 SH 脚本、网页标题、元数据(例如描述)、网页的小屏幕截图或类似内容中获取信息?

提前致谢!

最佳答案

您可以使用curl或wget获取网页,然后将其通过管道传递给sed以获取各种标签的内容。虽然这有点困惑,但是如果您使用 shell 脚本来做这些事情,您将会得到这样的结果。

例如

wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/"

将为您提供标题标签的内容。请注意,在此示例中,它为您提供了原始的未解析源,因此它看起来像 IANA &mdash; Example domains而不是IANA – Example domains .

你考虑过使用像 perl 这样的东西吗?

关于bash - 从 Linux 终端获取网页标题、图像、元数据信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11711339/

相关文章:

html - 如何在内容正上方添加新的 div 区域?

bash - 使用 tar 同步文件夹而不重新创建 tar

awk - 如何使用 POSIX shell 脚本删除文件的特​​定行?

python - 使用 SIGINT 终止程序会使我的 shell 无法使用,为什么?

bash - bash 中的粘贴命令不会附加到文件末尾

bash - 如何定义一个 shell 脚本变量以在脚本之外具有作用域

javascript - jquery在javascript函数中隐藏div数组

javascript - 简单的 Vanilla javascript游戏

xml - 如何使用 bash 脚本编辑 XML?

bash - 在双引号内执行本地 bash 变量