我正在寻找比仅仅检查 if "word" in "check for word"
更可靠的方法来处理不可预测的字符串。
举个例子,假设我有以下句子:
"Learning Python!"
如果句子包含“Python”,我想评估为 true,但如果它是:
"Learning #python!"
使用空格作为分隔符进行分割会给我 ["learning", "#python"]
,它与 python
不匹配。
(注意:虽然我确实知道我可以针对这种特殊情况删除 #
,但问题是 1. 我正在标记编程语言,并且不想删除 #
中的 C#
,以及 2.这只是一个示例案例,我可以通过很多不同的方式查看人工输入的标题,包括我仍然想捕捉到的这些提示。)
我基本上想检查是否毫无疑问,我正在寻找的字符序列是否存在,尽管他们可能会以任何奇怪的方式提及它。有哪些方法可以做到这一点?我稍微研究过模糊搜索,但还没有看到任何查找单个单词的用例。
这里的最终目标是我有编程语言的标签,我想获取人们的流标题的标题,并标记该语言(如果标题中提到了该语言)。
最佳答案
如果单词包含“python”,此代码将打印 True
,忽略大小写。
import re
input = "Learning Python!"
print(re.search("python", input, re.IGNORECASE) is not None)
关于python - 检查字符串中具有不可预测分隔符的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63165645/