需要从 Java 中的源字符串中提取主题标签字符串。有什么想法/例子吗?
谢谢, 斯里
最佳答案
这是我正在使用的(它也处理 UTF-8 标签,而不仅仅是 ASCII):
private static final Pattern TAG_PATTERN =
Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");
顺便说一句,您应该能够从推文实体中获取主题标签 (include_entities=true
)
关于Java Regex - 从字符串中提取主题标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4984806/