我仍然是 R 的新手,我无法弄清楚。我有一个看起来像这样的数据框:
Age State Diagnosis
12 Texas Lung Cancer
67 California Colon Cancer
45 Wyoming Lung Cancer
36 New Mex. Leukemia
58 Arizona Colon Cancer
35 Colorado Leukemia
我需要一个程序,它以某种方式打印或添加到另一个数据框中,将位于每列中的所有不同字符串。所以我可以知道所有的“类型”。例如,在“诊断”列的情况下,程序应该创建一个只有“肺癌、结肠癌和白血病”的数据框,因为只有这 3 种类型,即使它们是重复的。
最佳答案
您可以使用 unique
.
假设您有一个数据框 data
有了所有信息,您可以使用功能unique()
列出所有出现的情况,删除重复项:
types <- unique(data$diagnosis)
关于r - 列出 R 中数据帧中的所有不同字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61274061/