regex - 用于捕获表情符号所有肤色变化的正则表达式

标签 regex emoji oniguruma emoji-tones

我正在尝试使用正则表达式来捕获至少两次包含子字符串 👏 的推文,因此我使用的是简单的 ^.+ 👏 .+ 👏 .+$。但是,这不匹配包含例如 👏🏼 的字符串。

有没有一种聪明的方法可以捕获具有任何或没有肤色变化的表情符号,而无需将每个表情符号放在一行中(例如 [👏👏🏻👏🏼👏🏽👏🏾👏🏿])?

最佳答案

多亏了上面的评论,我发现我在 Twitter 上遇到的表情符号是 unicode,肤色变化是组合 1f3fb1f3ff 范围内的字符>.

http://unicode.org/reports/tr51/#Emoji_Modifiers_Table

所以对我来说,我想要的是 👏[\x{1f3fb}-\x{1f3ff}]?,以及 [\x{1f3fb}-\x{1f3ff}] ? 是我可以放在任何未修改的表情符号旁边以包含肤色变化的东西。

关于regex - 用于捕获表情符号所有肤色变化的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36331572/

相关文章:

regex - 正则表达式 0*1*1+11*0*1 DFA

python - 正则表达式不匹配任何组,第一组或第二组,但不能同时匹配。类似于 'NAND'

iphone - 如何在 iOS 应用程序中显示不在 Unicode 字符表中的自定义表情符号?

html - Unicode 表情符号的颜色

javascript - 使用 Emscripten 将 Oniguruma 正则表达式库编译为 javascript

regex - 如何使用正则表达式删除没有单词的行?

regex - 检查字符串中是否有日期并提取字符串的一部分

python - 如何从 Python 列表中删除日期

r - twitteR 和 R 的 Twitter 表情符号编码问题