r - 在 R 中操作基因型文件

标签 r regex bioinformatics

我有一个 csv 文件,其中包含几个二倍体个体的遗传信息。它看起来像下面的测试文件:

 Sample  L1 L1.1  L2 L2.1
      1 100  100 200  220
      2 100  100 220  220
      3 110  100 220  220
      4 100  110 220  220
      5 110  110 220  220

我需要合并信息,使数据框如下所示:

 Sample L1  L2 
      1 100 200
      1 100 220
      2 100 220
      2 100 220
      3 110 220
      3 100 220
      4 100 220
      4 110 220
      5 110 220
      5 110 220

有人知道对大型数据集执行此操作的好方法吗?

非常感谢。

最佳答案

试试这个:

#dummy data
df <- read.table(text="
Sample  L1 L1.1  L2 L2.1
1 100  100 200  220
2 100  100 220  220
3 110  100 220  220
4 100  110 220  220
5 110  110 220  220
",header=T)

#transform
df1 <- data.frame(Sample=rep(df$Sample,2),
                  L1=c(df$L1,df$L1.1),
                  L2=c(df$L2,df$L2.1))
#order by Sample
df1[order(df1$Sample),]

关于r - 在 R 中操作基因型文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19821415/

相关文章:

r - 返回R中行中三个最高值的函数

c++ - 匹配序列的正则表达式

r - 按列名排序数据框

r - 将 yy.mmd(d) 日期格式转换为 R 中的 yyyy-mm-dd

r - devtools::load_all() "cannot find function x"当函数 x 是加载包的一部分时

r - data.frame 中的行数相等

javascript -/g模式匹配的行为

php - 如果字符串不是链接,则正则表达式替换字符串中的单词

随机森林错误: NA not permitted in predictors (but no NAs in data)

bioinformatics - Snakemake 中规则特定的通配符