linux - 通过 shell 脚本获取网站的 Url

标签 linux shell ubuntu wget

我正在尝试构建一个 shell 脚本,该脚本在执行时可以将网站的 url 提取到一个文本文件中,这样我就可以将该文本文件用作 wget 的输入

最佳答案

这是一个简单的 Firefox 解决方案:

Firefox 更新 places.sqlite每次访问旧的或新的 url 时,即每次您的一个选项卡的位置栏之一发生变化时,数据库。

通过 SQL 查询此数据库非常容易。这是一个监视文件并将任何更改打印到控制台的小脚本:

#!/usr/bin/env bash
places=$(find $HOME/.mozilla -name places.sqlite)

lastDate=0

warn(){
    echo "$*" > /dev/stderr
}

fail() {
    warn "$*"; exit 1
}

[ -f "$places" ] || fail "places.sqlite not found"

warn "starting to watch $places at time: $lastDate"

while sleep 1; do
    count=$(sqlite3 $places "select count(*) from moz_places where last_visit_date > '$lastDate'")
    if [ $count -gt 0 ]; then
        sqlite3 $places "select url from moz_places where last_visit_date > '$lastDate'"
        lastDate=$(echo "$(date +%s%N) / 1000" | bc)
    fi
done

如果您愿意,可以将输出重定向到一个文件:sh watchscript.sh > myfile.txt

关于linux - 通过 shell 脚本获取网站的 Url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15623265/

相关文章:

python - 如何让 Pymacs 在 Ubuntu 中使用 EPD python 工作?

java - Ubuntu 上的 Ionic 在运行 "ionic emulate android"命令时出现 java 错误

c - 如何解决阻塞套接字(用于 SSL 握手)的 Connect() 超时问题?

c - linux内核中的中断

linux - 在 OpenStack 中安装 Sahara

java - 执行 shell 命令时,channelExec.setCommand() 不起作用

Apache 配置问题

linux - waitpid的用意是什么

linux - 如何从 echo stat 命令仅获取 IP 地址

用于删除超过 2 周的备份的 Shell 脚本