count_items=`curl -u username:password -L "websitelink" | sed -e 's/<\/title>/<\/title>\n/g' | sed -n -e 's/.*<title>\(.*\)<\/title>.*/\1/p' | wc -l`
上面我有一个从 XML 文件中提取标题的 Bash 脚本,但是如何更改正则表达式以便它从 div 标记中提取标题名称?
示例:从中提取标题:<div id="example""><a href="">title</a></div>
我知道通过 Bash 完成很愚蠢,但我别无选择,我们将不胜感激。
最佳答案
我推荐使用 xmlstarlet而不是尝试使用正则表达式解析 XML。
关于regex - Bash 脚本 sed -e,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3307971/