我正在用 clojure 开发一个项目,它可以与任何 java 类互操作,所以我的问题的答案可能是 java 或 clojure。
基本上,我需要能够根据给定的分隔符(多于一个字符)将字符串拆分成组件,但同时保留分隔符。
例如:
splitting "test:test:test" on ":" => [ "test" ":" "test" ":" "test" ]
splitting "::test::test::" on "::" => [ "::" "test" "::" "test" "::" ]
我使用的壁橱是使用 clojure 的 clojure.string/split
,但它实际上并不返回分隔符。第二个最接近的是使用 StringTokenizer,它确实返回分隔符但不接受多字符分隔符。
除了将字符串分解成一系列字符并对其运行奇怪的 reduce 之外,还有其他解决方案吗?
最佳答案
这是一个构建正则表达式以匹配定界符前后间隙的版本,而不是定界符字符串本身(假设 d
中没有正则表达式特殊字符):
=> (defn split-with-delim [s d]
(clojure.string/split s (re-pattern (str "(?=" d ")|(?<=" d ")"))))
#'user/split-with-delim
=> (split-with-delim "test:test:test" ":")
["test" ":" "test" ":" "test"]
=> (split-with-delim "::test::test::" "::")
["" "::" "test" "::" "test" "::"]
关于Java/clojure : Multiple character delimiter, 并保留分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15286711/