r - 如何对数据字符串中的唯一值进行字符串计数

标签 r tidyverse

我试图找到具有 的常用词5 个独特的元音 (即:“aeiuo”没有一个词也没有重复)
我试过这个:

library(tidyverse)
x<-c("appropriate","associate","available","colleague","experience","encourage","encouragi","associetu")
x[str_count(x,"[aeiuo]")>4]
请注意,单词( "encouragi" "associetu" )用于验证我的预期答案
我生成的结果如下:
[3] "available"   "colleague"  
[5] "experience"  "encourage"  
[7] "encouragi"   "associetu"
虽然我只想得到:"encouragi" "associetu"满足具有 5 个不同元音的标准(即:“aeiuo”)。
有没有什么功能可以充当 string_count_unique ??如果是,是哪一个?如果没有,您可以推荐我使用哪些其他功能,以便我满足既定标准?
预先感谢您的帮助!

最佳答案

一种选择可能是:

x[lengths(lapply(str_extract_all(x, "a|e|i|u|o"), unique)) == 5]

[1] "encouragi" "associetu"

关于r - 如何对数据字符串中的唯一值进行字符串计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65922063/

相关文章:

r - 使用 map (purrr) 将参数传递给 R 自定义函数

python - 使用 R 或 Python 从简单的列表颜色中绘制包含国家/地区的世界地图

r - 实现 Izhikevich 神经元模型

r - <unescaped bksl>S4method 记录替换函数时出错

R 通过与其他数据框合并,将值添加到数据框中的现有列

r - 使用 R tidyverse 将 double 转换为整数

r - 修复 RMarkdown 文档中的 ggplot 面板宽度

Row_wise 和 column_wise 使用 fill 和 down/across 填充 NA

r - Lintr - 有没有办法抑制大写数据框列名称警告?

R:将 tidyverse 连接到多个核心时如何使其安静。 ( Markdown )