python - 字符串解析为特定字符(Python)

标签 python

Vogue (@voguemagazine) • Instagram photos and videos

Fashionista (@fashionista_com) • Instagram photos and videos

The Business of Fashion (@bof) • Instagram photos and videos 我解析了 <title> 中的字符串Instagram 页面中的标签。

我需要解析屏幕名称,它是 (@....) 之前的所有字符串在上面的字符串中。

对于上面的示例,它将是 Vogue , Fashionista ,和The Business of Fashion分别。

我尝试过类似的事情

string.split(' ')[0].replace('\n', '')但这只是解析第一个标记。

最佳答案

模块“re”会有所帮助。请在下面找到使这成为可能的模式:

import re
pattern = re.compile("(.+?) \(@.*?\)")

string = "Vogue (@voguemagazine) • Instagram photos and videos"
word = pattern.findall(string)[0]

在模式“(.+?)\(@.*?\)”中

  • (.+?) - 捕获空格(“”)和括号之前的所有字符;
  • \(@.*?\) - 捕获 括号中的内容(即“(\”和“\)”之间),例如“@” 以及所有其他字符(“.*?”)

关于python - 字符串解析为特定字符(Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53369150/

相关文章:

python - 将函数应用于将另一列作为 Python Pandas 中的参数的列

python - 如何检查 python 中是否存在两个 key ,lib : pynput

python - 如何使用levenshtein函数删除pandas中的相似值

python - Scipy 稀疏矩阵 - 密集向量乘法性能 - block 与大型矩阵

python - Qscrollarea 不显示滚动条并且布局弹出不合适

python - Win32com python : impossible to access a chart on excel

python - 如何在 django admin 外键下拉列表中更改显示文本

python - OpenCV不写文件

python - 根据本地时间计算 24 小时周期内每分钟的平均销售额 (HH :MM)

python - 获取所有早于 x 天的文件夹 (os.walk),删除