java字符串正则表达式分隔符

标签 java regex string

我对正则表达式的经验很少,所以在此先感谢。

我有一个字符串,比如

Doe Jane,Doe John。 Suess博士的作品。哈佛出版社(1984)。

我正在使用 string.split(regex) 根据我提供的正则表达式将字符串拆分为 String[]。我想把它分成作者、标题、出版信息。问题是在 Dr. 之后使用 [.] 将其分解。

如何编写包含“.”的正则表达式但不包括“博士”之类的东西或“先生” ?

谢谢

最佳答案

我建议使用专门的包来解析书目条目,例如 ParsCit .

我试过他们的 Web 界面,它似乎开箱即用地正确解析了您的示例。

使用正则表达式,您将面临一场艰苦的斗争,因为您必须弄清楚并说明标题中每一次可能使用的句号。

关于java字符串正则表达式分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9182264/

相关文章:

java正则表达式提取页面标题

regex - perl6 彩色匹配,一些正则表达式插值有效,有些无效;颜色代码不一致

java - 字符串中的字符串替换

jQuery 从字符串中获取数字

java - 最长递增子序列问题 - 朴素方法

java - 如何从外部更新JavaFX场景?

java - JSTL <c :if> tag 中的测试属性

.net - VBA:与 .NET 正则表达式平衡组不兼容?

java - 使用run方法启动一个观察者线程

javascript - 确认字符串的结尾(可变结尾长度)