有什么方法或任何工具可以用来从 SH 脚本、网页标题、元数据(例如描述)、网页的小屏幕截图或类似内容中获取信息?
提前致谢!
最佳答案
您可以使用curl或wget获取网页,然后将其通过管道传递给sed以获取各种标签的内容。虽然这有点困惑,但是如果您使用 shell 脚本来做这些事情,您将会得到这样的结果。
例如
wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/"
将为您提供标题标签的内容。请注意,在此示例中,它为您提供了原始的未解析源,因此它看起来像 IANA — Example domains
而不是IANA – Example domains
.
你考虑过使用像 perl 这样的东西吗?
关于bash - 从 Linux 终端获取网页标题、图像、元数据信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11711339/