python - 如果字符串单词包含特定字符,则删除包含该字符的单词

标签 python python-2.7 python-3.x

假设我有如下数据,

data['sentences']

This is a sentence
Donald Trump
Machine Learning
Python is good

我想搜索字符模式,如果找到,则需要删除包含该字符的单词。

假设我想删除带有“enc”、“ood”和“ump”的单词,输出应该是,

data['sentences']

This is a 
Donald 
Machine Learning
Python is 

我在使用 re.sub 的地方尝试了以下操作,

re.sub("enc", "", y)

但这给出的输出类似于 This is a sente 。我不知道如何删除整个单词。

任何人都可以帮我用Python来做这件事吗?我想找到有效的方法来执行此操作,因为我想使用 pyspark 运行近 10 亿条记录。有人可以帮我做这个吗?

谢谢

最佳答案

在标识符之前和之后添加迭代:

re.sub(r'\w*enc\w*', '', y)

这会将所有字母数字字符以及指定的字符串(即它包含的单词)替换为空白。

关于python - 如果字符串单词包含特定字符,则删除包含该字符的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39355026/

相关文章:

python - 如何在Python Selenium中选择与一个CSS选择器匹配的前N个网站元素?

python - 运行 ./pythonscript 和 python pythonscript.py 之间的区别

python - 在 Python 中运行 C 扩展比普通 C 更快

multithreading - Python - 如何实现 'stoppable' 线程?

python - 读取管道(C/C++),没有错误,但不是所有数据

python - 如何使用 Python 的 Click 包从装饰器返回参数值?

Python ssh 使用 Tor 代理

python - 为什么 Python 字符串中的 3 个反斜杠等于 4?

python - 无法使用python脚本在字典中输入字符

python-3.x - 星期几程序 Python3