R - 表情符号 unicode 到字符

标签 r encoding character-encoding emoji emoticons

我正在使用 R 进行编码。假设我的表情符号的 unicode 值为

wink_emoji <- "\U0001f609"

或者,作为

wink_emoji <- "U+1f609"

是否有一个函数可以用来将实际的表情符号字符打印到控制台?像这样:

[1] "😉"

作为它的 HTML 字符实体怎么样?

[1] "&#128521;"

此外,如果我有一个像这样的字符串:

test <- "This is a test U+1f609 U+1F469 U+200D U+2764 U+FE0F U+200D U+1F48B U+200D U+1F469"

我可以通过一个函数运行它来匹配所有表情符号并返回:

[1] "This is a test 😉👩‍❤️‍💋‍👩"

最佳答案

使用utf8包中的utf8_print进行打印,utf8ToInt获取代码点的整数值:

wink_emoji <- "\U0001f609"
utf8::utf8_print(wink_emoji)
#> [1] "😉​"
utf8ToInt(wink_emoji)
#> [1] 128521

(打印表情符号仅适用于 MacOS 和 Linux,不适用于 Windows。)

关于R - 表情符号 unicode 到字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48102822/

相关文章:

r - 为什么列名会连接到线性模型摘要的行输出中?

r - 如何处理两个列表中的NA?

从R中的多列中删除字符串

r - 在 geom_abline 中跨面使用不同的斜率

python - BeautifulSoup 3.1.0.1 和 Python 2.5.2 的 UnicodeEncodeError

unicode - UTF-8 编码如何识别单字节和双字节字符?

python - 如何使用 Python 读取 utf-8 编码的文本文件

video - 重新编码视频时奇怪的 FPS 和帧数

c# - 处理包含 "question mark"(�) 的字符串时出现编码问题

php - 循环遍历 MySQL 数据库,使用 UTF-8 版本更改撇号