我对正则表达式的经验很少,所以在此先感谢。
我有一个字符串,比如
Doe Jane,Doe John。 Suess博士的作品。哈佛出版社(1984)。
我正在使用 string.split(regex) 根据我提供的正则表达式将字符串拆分为 String[]。我想把它分成作者、标题、出版信息。问题是在 Dr. 之后使用 [.] 将其分解。
如何编写包含“.”的正则表达式但不包括“博士”之类的东西或“先生” ?
谢谢
最佳答案
我建议使用专门的包来解析书目条目,例如 ParsCit
.
我试过他们的 Web 界面,它似乎开箱即用地正确解析了您的示例。
使用正则表达式,您将面临一场艰苦的斗争,因为您必须弄清楚并说明标题中每一次可能使用的句号。
关于java字符串正则表达式分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9182264/