当 R 中以小写字母开头时,从数据框单元格中删除第一个单词

标签 r regex taxonomy

我想清理 R 中细菌种类的分类表我想删除所有以小写字母开头的单元格中的值。

我有一个来自分类 df 的列:

<表类=“s-表”> <标题> 物种 <正文> 不动土翁菌 Woesebacteria 身份不明的海洋生物 细菌 Ellin506

我想要:

<表类=“s-表”> <标题> 物种 <正文> 不动土翁菌 Woesebacteria
unwanted <- "^[:upper:]+[:lower:]+"
tax.clean$Species <- str_replace_all(tax.clean$Species, unwanted, "")

但它似乎不起作用,并且与所需的物种不匹配。

最佳答案

如果您正在使用数据帧,我建议使用dplyr::filter来清理数据帧。

grepl() 返回逻辑值,!grepl(^[[:lower:]]) 查找任何不以小写字母开头的内容 (^ 表示字符串的开头)。

library(dplyr)

df %>% filter(!grepl("^[[:lower:]]", Species))

               Species
1 Tuwongella immobilis
2        Woesebacteria

关于当 R 中以小写字母开头时,从数据框单元格中删除第一个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71571979/

相关文章:

r - 将最近邻列表转换为r中的二元邻接矩阵

wordpress - 如何从 Wordpress 中删除分类法?

wordpress - WordPress 3.0.1 中的自定义帖子类型和分类永久链接重写

php - 下拉选择器中的 WooCommerce 品牌分类术语列表

python - 将 R 数据框加载到 Python 中并转换为 Pandas 数据框

regex - 修剪数据框中的部分字符串

r - 使用cowplot的plot_grid放置图例

regex - 用尾随 9 舍入数值

javascript - 在 Javascript 中将字符串中的值提取到数组中

regex - 我的URL重写规则中出现500个内部服务器错误