r - 将重复项移动到新列中

标签 r excel formatting

<分区>

我有这个包含两列的数据库,其中列出了基因代码,然后列出了生物通路。在数据库中,一些基因代码与多种生物途径相关联:

      A           B
    396139  mesonephros development    
    396139  camera-type eye development  
    396139  Sertoli celldevelopment

我试图摆脱这些重复,同时将每个生物学功能移至新列:

  A       B                         C                           D
396139    mesonephros development   camera-type eye development Sertoli celldevelopment

我已经在 Excel 中尝试了一些宏,但没有成功地做出任何有建设性的事情。我对 R 也有点陌生,所以我不知道从哪里开始格式化它。任何对这两种软件的帮助都将不胜感激。

这个问题与声称的重复问题不同,因为当我要求它们分开时,他们试图合并列。这个问题的答案也更简单,不需要外部包,因此值得分开。

最佳答案

我们可以使用data.table。我们将“data.frame”转换为“data.table”(setDT(df1)),按“Gened.Code”分组,我们粘贴“Organ”中的元素.Developmental.Effect' 在一起。 toStringpaste(., collapse=', ') 的包装器。

library(data.table)
setDT(df1)[, list(Col= toString(Organ.Developmental.Effect)) , Gene.Code]
#   Gene.Code
#1:        11
#2:        19
#3:        37
#4:       674
#5:      2033
#6:     2-Sep
#7:     5-Sep
#8:    396139
#                                                                             Col
#1:                                        eye photoreceptor cell differentiation
#2:                                        eye photoreceptor cell differentiation
#3:                                        eye photoreceptor cell differentiation
#4:                                           larval salivary gland morphogenesis
#5:                                                    compound eye morphogenesis
#6:                                                     imaginal disc development
#7:                                                     imaginal disc development
#8: metanephros development, mesonephros development, camera-type eye development

关于r - 将重复项移动到新列中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33897024/

相关文章:

javascript - HTTP 状态 500 – 内部服务器错误,同时使用 esign genie api 在 vm 中下载 excel 文件

VBA - 如何在excel范围的末尾添加一个绝对总和行

excel - 如何在Excel条件格式中自动填充条件?

r - R lda 包中 lda.collapsed.gibbs.sampler 命令的输出

r - 整理宇宙 : consecutive appearance of zeros

r - 使用 'OptimalCutpoints' 包查找最佳切点

python - 对 Excel 中的整行应用条件格式

r - 根据 R 中的分类变量比较两组

arrays - 上个月和年份来自以月份为文本的列和以年份为数字的列

html - 在 HTML 文本区域中格式化特殊文本