python - 在数据帧列中查找字符串 "Quote"之后的数字

标签 python regex pandas

我有一份 Excel 表格中的客户服务调用日志。以下是我的数据格式

So#   Comments
1   sjhsh QUOTE 234566
1   sdsds customer call QUote 239876 Call back
2   adsdfh unknown call from customer QUOTE 189067 sdkjsd woieweio 
3   QUOTE 657894 customer called for service

我正在从 Excel 中读取此数据,需要获取每行中文本“QUOTE”后面的 6 位数字,然后将提取的数字添加为新列

1.The rows might have multiple "QUOTE" mentions 2.The rows might not have "QUOTE"at all

有人可以帮我使用 python 进行子字符串搜索吗

import pandas as pd
import re
file=pd.read_excel("C:/Users/rkatta/Desktop/Book1.xlsx")
file.set_index('Index', inplace=True, drop=True)
comments=file['InternalComments']
quotenum=[]

keyword= 'QUOTE'
for i in comments:
    try:
        befor_keyowrd, keyword, after_keyword = comments[i].partition(keyword)
        num=after_keyword[:6]
        quotenum.append(num)
    except AttributeError:
        befor_keyowrd, keyword, after_keyword =''
        quotenum.append(after_keyword)

最佳答案

(?i)(?<=QUOTE )\d+将捕获您正在寻找的数字。

(?i)表示模式的其余部分不区分大小写,因此它将匹配“QUote”以及该单词的任何变体。

(?<=QUOTE )表示数字前面将带有引号和空格

\d+是你的电话号码

Demo

关于python - 在数据帧列中查找字符串 "Quote"之后的数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51159898/

相关文章:

ios - swift 正则表达式格式?

python - 用多个变量替换 pandas 中的多列

python - 在 Python 中取消融化 Pandas 数据框?

python - 如何使用 python 3 查找损坏的 mp3 文件?

python - 如何使用 Python 合并 CSV 字符串中的字段?

python - 覆盖源代码中 setup.cfg 中的 DEFINE

c++ - 在 Qt 中捕获标签内的数字

python - 特定的 pandas 列作为 df.apply 输出的新列中的参数

javascript - 输入模式 ='[a-zA-Z]' 在 React 应用程序中不起作用

python - Pandas 从长到宽,多列