r - 计算 R 和 excel 中的唯一值

标签 r excel

我有一个奇怪的问题。我想计算某一列中的唯一条目。在这里,我附上了我的 csv 文件。

我这样做是为了获取列中的唯一条目:

dat<-read.csv("Book1.csv")
names(dat)<-c("user_name")
unique(dat$user_name)

结果显示我有 170 个唯一值。

但是当我在 Excel 中执行“删除重复条目”时,我在列中有 147 个唯一条目。

谁能解释为什么结果不匹配,或者我做错了什么?

访问 https://drive.google.com/file/d/0B71VF2HepgVyaFVKSFZrUFhGWm8/edit?usp=sharing对于我的 csv 文件

最佳答案

我的钱是安全的。 Excel 忽略大小写的差异。您可以通过将数据转换为大写并注意到您也有 147 个唯一值来判断这一点:

> d=dat$user_name
> length(unique(d))
[1] 170
> dUp=toupper(d)
> length(unique(dUp))
[1] 147
> 

另请注意,我认为您正在丢失 CSV 中的第一个值,因为 read.csv默认认为第一个元素是标题。

关于r - 计算 R 和 excel 中的唯一值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20759346/

相关文章:

r - 如何在 Rcpp 中打印原始值

r - 无法在 R 中安装 "raster"包

r - 如何将 R 数据帧作为 CSV 文件上传到 Azure Blob 存储上?

Excel - 以公式形式获取工作日开始日期

arrays - 如何打印for循环结果在R中的上三角矩阵

vba - 如果范围内的单元格与字符串相同,则在其下的单元格中进行计算

r - 努力让 while 语句继续迭代 R 中的每一行

performance - R:通过引用传递数据帧

r - 专有软件生成丑陋的 Excel 表格...我可以将它们导入 R 吗?

excel - VBA宏将过滤后的数据复制并粘贴到新工作表