Java Regex - 从字符串中提取主题标签

标签 java regex twitter

需要从 Java 中的源字符串中提取主题标签字符串。有什么想法/例子吗?

谢谢, 斯里

最佳答案

这是我正在使用的(它也处理 UTF-8 标签,而不仅仅是 ASCII):

private static final Pattern TAG_PATTERN = 
   Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");

顺便说一句,您应该能够从推文实体中获取主题标签 (include_entities=true)

关于Java Regex - 从字符串中提取主题标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4984806/

相关文章:

php - codebird-php 推特应用程序。验证 Twitter API 证书时出现错误 77

twitter - 我可以使用 fabric sdk 在我的时间线上设置自定义 onClick 吗?

java - 不明白 <T> 和 <?> 的一些内容

java - 插件: Best way to safe a file in a project structure?

java - Libgdx 读取 Android 的内部文本文件

javascript - Firefox 在针对正则表达式编译长词时抛出过于复杂的错误

java - 如何识别字符串中重复字符的模式?

java - 多次正则表达式两个字符串之间的所有内容

python - 计算 Twitter 上特定单词的结果数(API v1.1)

运行 Hadoop Map Reducer 时发生 Java 编译错误