r - 如何将列数据变成列名?

标签 r dataframe dplyr tidyr reshape2

我得到了一个光谱学引用数据库,它与我正在使用的示例数据集有很大不同。在我的数据中,0 或 1 表示是否存在峰值,而在引用数据库中,峰值位置被列为行值并根据肽数据(我不需要)分组为列。

我的数据集如下所示:

Sample   1110   1111   1112
1         1        0      0
2         1        0      1
3         0        1      1
4         1        1      1

虽然引用数据库看起来像这样(请注意每列有多个值):

Species     peptide1   peptide2    peptide3
cow           1110        1112         NA
sheep         1111        1112         NA
goat           NA         1113        1114

所需的输出看起来类似于我的数据集:

Species   1110    1111    1112    1113    1114
cow         1        0      1        0      0
sheep       0        1      1        0      0
goat        0        0      0        1      1

这些过于简单化了,但它们说明了问题 - 如果我需要提供实际数据,请告诉我。我需要对单元格中的值进行转置/排序,同时替换二进制文件中的原始值(同样,我不需要将肽列名称保留在引用数据库中)。我真的希望有一个简单的 dplyr 或 tidyr 技巧 - 我想一个传播函数可以工作,但我不知道如何为多列做这件事,也不知道如何保留原始数据。或者,我可以手动将所有数据附加为长格式,然后将其熔化/转换为更宽的格式?

最佳答案

希望这就是您要找的:

library(dplyr)
library(tidyr)

df %>%
  pivot_longer(!Species) %>%
  mutate(val = 1) %>%
  select(-name) %>%
  drop_na() %>%
  arrange(value) %>%
  pivot_wider(names_from = value, values_from = val) %>%
  mutate(across(!Species, ~ replace_na(., 0)))

# A tibble: 3 x 6
  Species `1110` `1111` `1112` `1113` `1114`
  <chr>    <dbl>  <dbl>  <dbl>  <dbl>  <dbl>
1 cow          1      0      1      0      0
2 sheep        0      1      1      0      0
3 goat         0      0      0      1      1

数据

df <- tribble(
  ~Species,     ~peptide1,   ~peptide2,    ~peptide3,
  "cow",           1110,        1112,         NA,
  "sheep",         1111,        1112,         NA,
  "goat",           NA,         1113,        1114
)

通过使用 pivot_longer()pivot_wider() 真正有用的参数来简化上述语法

df %>% 
  pivot_longer(!Species, values_drop_na = TRUE) %>% 
  pivot_wider(id_cols = Species, names_from = value, names_sort = TRUE, values_fill = 0, values_fn = length)

# A tibble: 3 x 6
  Species `1110` `1111` `1112` `1113` `1114`
  <chr>    <int>  <int>  <int>  <int>  <int>
1 cow          1      0      1      0      0
2 sheep        0      1      1      0      0
3 goat         0      0      0      1      1

关于r - 如何将列数据变成列名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67222757/

相关文章:

使用 rvest 并行读取多个 html 页面

r - 如何将打印函数输出放入数据框中

r - 如何使用dplyr进行编程

r - 在R中将两个数据框制作成相同的形式

R Shiny : conditionalPanel with condition based on textInput (how to)

还原列表结构

r - 在 R 中按多个组查找更新值

python - 使用read_sas后如何从pandas对象类型的b'Text'中获取文本?

r - 根据列表对列进行排序,然后对数据框中的另一列进行排序

r - 树中使用的变量