r - 如何在 R 的摘要输出中查看隐藏在 "Other"下的元素?

标签 r output cluster-analysis k-means summary

我正在使用以下数据集对分类数据执行聚类分析 - link to data set - 在 R 中使用以下包:

library(cluster)
library(dplyr)
library(ggplot2)
library(readr)

通过以下代码,我可以观察 5 个集群内的客户端概况(注意:我选择 5 个集群而不是 7 个或 8 个集群,以使事情或多或少变得简单):

df.torun <- subset(df.bank, select = -c(loan, contact, day, month, duration, campaign, pdays, previous, poutcome, y))

gower_dist <- daisy(df.torun, metric = "gower")

gower_mat <- as.matrix(gower_dist)

sil_width <- c(NA)
for(i in 2:8){
  pam_fit <- pam(gower_dist, diss = TRUE, k = i)
  sil_width[i] <- pam_fit$silinfo$avg.width
}

plot(1:8, sil_width,
     xlab = "Number of clusters",
     ylab = "Silhouette width")
lines(1:8, sil_width)

k <- 5
pam_fit <- pam(gower_dist, diss = TRUE, k)
pam_results <- df.torun %>% 
  mutate(cluster = pam_fit$clustering) %>% 
  group_by(cluster) %>% 
  do(the_summary = summary(.))
pam_results$the_summary

如果您使用我共享的数据运行此脚本,您将能够看到有关客户个人资料的大量信息,类别如下:年龄、工作、婚姻、教育、默认、平衡和住房。以下是我获得的集群 1 结果的屏幕截图:

Results I get for cluster 1

如上图所示,在job列下,一些结果“隐藏”在类别(其他)下。

我的问题:我可以使用什么代码列出 job 列中“隐藏”在(其他)下的所有单词?

非常感谢您的帮助!

最佳答案

您可以使用maxsum=示例:

d <- data.frame(x=gl(10, 5), y=rnorm(50))

summary(d)
#       x            y          
# 1      : 5   Min.   :-1.7459  
# 2      : 5   1st Qu.:-0.8480  
# 3      : 5   Median :-0.2293  
# 4      : 5   Mean   :-0.1439  
# 5      : 5   3rd Qu.: 0.4109  
# 6      : 5   Max.   : 2.5951  
# (Other):20            

summary(d, maxsum=11)
#  x           y          
# 1 :5   Min.   :-1.7459  
# 2 :5   1st Qu.:-0.8480  
# 3 :5   Median :-0.2293  
# 4 :5   Mean   :-0.1439  
# 5 :5   3rd Qu.: 0.4109  
# 6 :5   Max.   : 2.5951  
# 7 :5                    
# 8 :5                    
# 9 :5                    
# 10:5   

关于r - 如何在 R 的摘要输出中查看隐藏在 "Other"下的元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70670774/

相关文章:

r - 从函数返回后更改 ggplot 对象的点大小

c - 获取数组的输入

cluster-analysis - ELKI 中的并行 DBSCAN

r - 标题内的标题到列表

r - 从两个向量创建元组

r - 为 R 中文件夹中的所有文件添加文件扩展名

java - Java 的测试用例实现类似于 topcoder/codechef

Android - 连接测试结果目录

algorithm - 基于点的局部线性分割一组点的分割算法

java - 地理位置聚类