我正在尝试对包含有用文本但也包含许多我不需要的数字的文本文件进行标记化。但是,使用 [^a-zA-Z0-9]
之类的东西,我保留了所有数字 (0-9)
。
我希望仅在附加到字符或像“24hr”或“7-days”这样的连字符时保留数字。
因此,输入:“每周 7 天,有 3 个 24 小时的职位空缺。请调用 555-1212”
返回以下代币的列表:每周 7 天,有 24 小时可用的职位电话
感谢您的帮助!
最佳答案
\d+-?[A-Za-z]+|[A-Za-z]+-?\d+|[A-Za-z]+
在此处查看实际效果:http://regexr.com?318em
关于java - 在 Java 正则表达式中 - 如何仅在附加到字符串时保留数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11018585/