我有一个这样的字符串列表,叫做 F:
("hello word i'am walid""goodbye madame") => 这个列表包含两个字符串元素
我还有另一个这样调用 S 的列表 ("word""madame") => 这包含两个词
现在我想从列表 F 的每个字符串中删除列表 S 的元素,输出应该是这样的("hello i'am walid""goodbye")
我已经找到这个函数了:
(defun remove-string (rem-string full-string &key from-end (test #'eql)
test-not (start1 0) end1 (start2 0) end2 key)
"returns full-string with rem-string removed"
(let ((subst-point (search rem-string full-string
:from-end from-end
:test test :test-not test-not
:start1 start1 :end1 end1
:start2 start2 :end2 end2 :key key)))
(if subst-point
(concatenate 'string
(subseq full-string 0 subst-point)
(subseq full-string (+ subst-point (length rem-string))))
full-string)))
例子: (remove-string "walid""hello i'am walid") => 输出 "hello i'am"
但是有一个问题
例子:
(remove-string "wa" "hello i'am walid") => the output "hello i'am lid"
但输出应该像这样“你好,我是瓦利德”换句话说,我不会从字符串中删除确切的词
我有一个解决方案是使用
cl-ppcre:regex-replace-all "\\s*\\bwa\\b\\s*" "ba wa walid" " ")
很好,但有一个问题 cl-ppcre:regex-replace-all "\s*\bam\b\s*""i'am wa walid""")=>"i' wa walid"我不应该有 "i' am wa walid”因为“i'am”是一个霍尔词
最佳答案
您可以显式定义边界字符而不是使用 \b
。下面我使用空格、逗号、字符串的开头或结尾或句点作为边界字符。
(cl-ppcre:regex-replace-all
#?r"(\s|^|$|,|\.)(am)(\s|^|$|,|\.)"
"i'am wa walid"
#?r"\1 \3")
(注意:#?\r""
来自 cl-interpol:enable-interpol-syntax
并使正则表达式更易于阅读)
如果我们使用 interpol,那么它也可以包含我们单词的拼接点:
(let ((word "am"))
(cl-ppcre:regex-replace-all
#?r"(\s|^|$|,|\.)(${word})(\s|^|$|,|\.)"
"i'am wa walid"
#?r"\1 \3")
干杯,希望我回答的是正确的问题
关于lisp - 使用正则表达式从 lisp 中的字符串中删除一个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30314939/