我从word文档(.doc)中提取了一些文本数据并将其存储在变量my_text
中
这样
my_text[2] = '2 Running Hrs - \tPort M/E RPM \t- \t'
这里的\t是文档本身的分隔符。
我正在尝试提取单词“Running Hrs”和“\t”分隔符之间的单词/字符。
这样我就可以得到输出“-”
这里我尝试过
- 试用 1
import re
re.search('Running Hrs(.*)\t', my_text[2].strip()).group(1)
输出
' - \tPort M/E RPM '
- 试用 2
print(re.findall(r'\Running Hrs([^]\t*)\]', str(my_text[2])))
输出
ERROR: error: bad escape \R
对此有何建议。
最佳答案
您的第一次尝试非常接近您想要的,因为您只需要包含一个 ?
标志即可确保您的捕获组是非贪婪的,如下所示:
r'Running Hrs(.*?)\t'
如果没有这个 ?
标志,您的捕获组将被视为贪婪,并将尝试尽可能多地匹配,直到最后一个 \t
,而非贪婪表达式只会捕获直到第一个 \t
。
关于python - 提取单词和分隔符之间的单词python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60558776/