我想要实现的是提取短信中包含的所有 URL。当我说全部时,我指的是所有可点击的文本,即 SMS 中带下划线的文本。这是我正在尝试的代码,它可以工作,但前提是 URL 以 http/https/ftp 开头...而且我还需要获取没有它的 URL。
public static List<String> extractUrls(String sms) {
List<String> containedUrls = new ArrayList<String>();
String text = sms;
// Split the sms to analyze if each part is a URL
String[] split = text.split(" ");
// Attempt to convert each item into an URL
for (int i = 0; i < split.length; i++) {
if (URLUtil.isValidUrl(split[i])) containedUrls.add(split[i]);
}
return containedUrls;
}
最佳答案
你可以尝试使用正则表达式
public static List<String> extractUrls(String sms) {
List<String> containedUrls = new ArrayList<String>();
String text = sms;
// Split the sms to analyze if each part is a URL
String[] split = text.split(" ");
Pattern p = Pattern.compile("(@)?(href=')?(HREF=')?(HREF=\")?(href=\")?(http://)?[a-zA-Z_0-9\\-]+(\\.\\w[a-zA-Z_0-9\\-]+)+(/[#&\\n\\-=?\\+\\%/\\.\\w]+)?");
// Attempt to convert each item into an URL
for (int i = 0; i < split.length; i++) {
if (p.matcher(split[i]).matches()) containedUrls.add(split[i]);
}
return containedUrls;
}
关于java - 从短信中提取 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42762791/