python - 用于读取标签 Python 的正则表达式

标签 python html regex tags

我想用正则表达式读取标签中的元素,例如:

<td>Stuff Here</td>
<td>stuff 
</td>

我正在使用以下内容:re.findall(re.compile('<td>(.*)</td>'), str(line).strip())

我怎么能读到第一个<td>标记,但不是第二个?

最佳答案

对于一般情况,您can't use regular expressions for parsing markup .你能做的最好的事情就是开始使用 HTML 解析器,有很多 good options在那里,恕我直言Beautiful Soup是一个不错的选择。

关于python - 用于读取标签 Python 的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17135205/

相关文章:

java - 是否有任何用 Java 编写的正则表达式优化器?

javascript - CSS 顶部和左侧位置在 IE 中不起作用

javascript - 在非 InputElement 上调用 Angular2 单击事件

.net - 如何在 MSVS 2012+ 编辑器(和 .NET?)中使用正则表达式替换插入 ‘\’ +‘n’

python - Boto3 中的异常 - botocore.exceptions.EndpointConnectionError

javascript - 如何在 onsubmit 函数完成之前阻止提交表单?

java - 什么正则表达式将匹配 4 位数字,一个句点,然后是一位且只有一位?

python - 使用 arcpy Polyline 对象作为字典值时形状信息丢失

python - 最后 else if 语句不打印

用于创建 "webseed"torrent 文件的 Python 包?