我正在尝试使用 split()
方法来分割包含重复标签的长字符串(包含 CFML 代码的文本文档的内容),每个标签都以这 2 个字符结尾: ">
和换行符。
我不知道如何实现这一点,尝试了多个正则表达式,但没有成功,在提到的标签内部可以嵌套其他标签(请不要问为什么:-)),并且这些嵌套标签上的拆分会中断,即使它们不包含 ">
示例:
<cfset code = "Text text text <table style='width:538px; [... more text stripped ...] </table>">
<cfset another_code = "Text text text">
...
任何线索将不胜感激!
最佳答案
要使用纯正则表达式来完成此操作,我将使用 str.split(Pattern.quote("\">"))
。
但是,您应该考虑使用 XML 解析器,例如 SAX、StAX、DOM 解析器等。无需重新发明轮子。
关于java - 在“>”上分割长字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16088644/