r - 根据字符串长度过滤行名称

标签 r

这个问题在这里已经有了答案:





Remove all rows where length of string is more than n

(4 个回答)


3年前关闭。




我想过滤包含长于 35 且短于 10 的行名的行。
我在看 nchar功能。

                                    79_CGTACG.collapsed.gz 80_ACAGTG.collapsed.gz
CACCCGCACGTATAGACGGACA                                   0                      0
GTGCTGATGTCCTTGGCAGGCTTCGGCCGTCCGGC                      0                      0
CGTGGAACCTG                                              0                      0
TAATGGTCATTAG                                            2                      1
GGCGATGCGGGATGAACCGAAC                                   0                      0
AAGGATGT                                                 0                      0

最佳答案

我认为你的想法是使用 nchar()很好。这可以应用于rownames()并结合数据框的逻辑设置:

df1[nchar(rownames(df1)) > 35 | nchar(rownames(df1)) < 10,]
#         X79_CGTACG.collapsed.gz X80_ACAGTG.collapsed.gz
#AAGGATGT                       0                       0

数据
 df1 <- structure(list(X79_CGTACG.collapsed.gz = c(0L, 0L, 0L, 2L, 0L, 
0L), X80_ACAGTG.collapsed.gz = c(0L, 0L, 0L, 1L, 0L, 0L)), 
 .Names = c("X79_CGTACG.collapsed.gz", "X80_ACAGTG.collapsed.gz"), 
  class = "data.frame", row.names = c("CACCCGCACGTATAGACGGACA", 
  "GTGCTGATGTCCTTGGCAGGCTTCGGCCGTCCGGC", "CGTGGAACCTG", "TAATGGTCATTAG", 
 "GGCGATGCGGGATGAACCGAAC", "AAGGATGT"))

关于r - 根据字符串长度过滤行名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35902056/

相关文章:

r - 图例中的一些 bin 间隔未使用 ggplot 着色

Rvest 提交表单时找不到可能的提交目标

r - 在 data.frame ( 或 table ) 中保持范围

r - 如何在 igraph R 中创建自循环?

r - R 中用于验证 data.frame 上特定列是否存在的函数

r - R 中 a 规则的子集 lhs 长度

请求用户识别文件位置并从 R 中的文件位置自动提取变量名

r - 基于两列字符串匹配的子集 R 数据框

r - 并行 parLapply 设置

r - 错误: unexpected string constant