java - 从字符串中提取和删除实体

标签 java string extract text-extraction

我想要做的是从给定字符串中提取子字符串。

例如

String str = "Eminem - Not Afraid with lyrics 2010";
String str2 = "Eminem - Not Afraid (HQ)";
String str3 = " Eminem Not afraid (Lyrics)";

我想删除多余的单词,例如

lyrics
2010
HQ
()
with

如果我有一个包含所有“额外字符串”的哈希表

从给定字符串中删除多余字符串的最佳方法是什么?

我一开始使用了正则表达式,但它没有用,我还使用了一些实体提取来提取艺术家姓名(echonest),但它仅适用于艺术家

问题是如果歌曲包含额外的字符串,包含的额外字符串也将被删除。

请问各位,有什么帮助或建议吗?

谢谢

最佳答案

Apache 的 StringUtils 可能是您的 friend :

http://commons.apache.org/lang/api-2.5/org/apache/commons/lang/StringUtils.html

它比 JDK 附带的 String/String utils 更加通用。 (例如,它有一个“LastIndexOf”方法,可以帮助您获取具有多个“with”的字符串中的最后一个“with”)。

关于java - 从字符串中提取和删除实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7695385/

相关文章:

java - Android View /fragment 问题

java - JBoss 和 Eclipse 错误 : Insufficient memory for the Java Runtime Environment to continue

java - Java的clone()方法是实现多态克隆的唯一途径吗?

无法返回 0,即使字符串为 null

python - 在 Python 中连接列表和字符串

mysql - 尝试选择以特定字母开头和结尾的对象

php - 正则表达式从字符串中提取数字和点

Java、文件、Linux 和西里尔文

regex - 如何在机器人框架中使用正则表达式选择子字符串

vim - 如何使用vim从文本中提取特定段落?