我有一个奇怪的问题。我想计算某一列中的唯一条目。在这里,我附上了我的 csv 文件。
我这样做是为了获取列中的唯一条目:
dat<-read.csv("Book1.csv")
names(dat)<-c("user_name")
unique(dat$user_name)
结果显示我有 170 个唯一值。
但是当我在 Excel 中执行“删除重复条目”时,我在列中有 147 个唯一条目。
谁能解释为什么结果不匹配,或者我做错了什么?
访问 https://drive.google.com/file/d/0B71VF2HepgVyaFVKSFZrUFhGWm8/edit?usp=sharing对于我的 csv 文件
最佳答案
我的钱是安全的。 Excel 忽略大小写的差异。您可以通过将数据转换为大写并注意到您也有 147 个唯一值来判断这一点:
> d=dat$user_name
> length(unique(d))
[1] 170
> dUp=toupper(d)
> length(unique(dUp))
[1] 147
>
另请注意,我认为您正在丢失 CSV 中的第一个值,因为
read.csv
默认认为第一个元素是标题。
关于r - 计算 R 和 excel 中的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20759346/