regex - Bash 脚本 sed -e

标签 regex linux bash

count_items=`curl -u username:password -L "websitelink" | sed -e 's/<\/title>/<\/title>\n/g' | sed -n -e 's/.*<title>\(.*\)<\/title>.*/\1/p' | wc -l`

上面我有一个从 XML 文件中提取标题的 Bash 脚本,但是如何更改正则表达式以便它从 div 标记中提取标题名称?

示例:从中提取标题:<div id="example""><a href="">title</a></div>

我知道通过 Bash 完成很愚蠢,但我别无选择,我们将不胜感激。

最佳答案

我推荐使用 xmlstarlet而不是尝试使用正则表达式解析 XML。

关于regex - Bash 脚本 sed -e,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3307971/

相关文章:

django - 测试套接字激活失败,Django 和 Gunicorn

regex - 为什么 "f"匹配 Bash 正则表达式中的 c*?

javascript - 用于检测包含 URL 或文件扩展名的字符串的正则表达式

javascript - 在 jquery 中的最后一个文本之后添加字符串

用于确定电子邮件域的 JavaScript RegEx(例如 yahoo.com)

java.util.Scanner NoSuchElementException 且 LineFeed 终止文件长度为 1025 个字符

python - 如何在 Django 的一个 HTML 页面中打开两个日志文件?

linux - rsyncd.secrets 文件 linux 权限 : should not be read by group and others

python - 如何自动更新 python/bash 脚本?

bash - 如何每天晚上 10 点运行一次 cron