r - 排除状态小于某个聚合值的行

标签 r

我目前正在 coursera 上的视频的帮助下学习 R。当试图排除所有少于 20 个医院表格的州立医院时,由于缺乏 R 编程知识,我无法找到正确的解决方案(因为我有很多使用 C、Logic我尝试在R中实现也像C)

我使用的代码就像

>test <- read.csv("outcome-of-care-measures.csv", colClasses = "character")
>test[, 11] <- as.numeric(outcome[, 11])
>test2 <- table(outcome$State)

从表test2中,我可以获取特定行的值作为test2[[2]],但无法找出如何使用条件逻辑获得少于 20 家医院的州(如果我获得州名称,那么我可以使用 subset() 来解决实际问题)。我还查看了 dimnames() 函数,但可以找到任何解决我的问题的想法。所以我的问题是,在 R 中如何用表值检查阈值。

test2 中的值存储为

 AK  AL  AR  AZ  CA  CO  CT  DC  DE  FL  GA  GU  HI  IA  ID  IL  IN  KS  KY  LA  MA  MD  ME 
 17  98  77  77 341  72  32   8   6 180 132   1  19 109  30 179 124 118  96 114  68  45  37 
 MI  MN  MO  MS  MT  NC  ND  NE  NH  NJ  NM  NV  NY  OH  OK  OR  PA  PR  RI  SC  SD  TN  TX 
134 133 108  83  54 112  36  90  26  65  40  28 185 170 126  59 175  51  12  63  48 116 370 
 UT  VA  VI  VT  WA  WI  WV  WY  ##State Name
 42  87   2  15  88 125  54  29  ##Count of Hospital

最佳答案

Arun在他的评论中也指定了...您可以将其作为 names(test2[test2 >= 20]) 来获取高于 20 家医院的状态... Here很好地解释了为什么必须避免子集

关于r - 排除状态小于某个聚合值的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14650370/

相关文章:

r - 使用 qplot 的多层平滑图

arrays - 获取向量中最后 n 个条目的 R 快捷方式

返回 r 中的最后一个非零元素索引

r - 如何获得选择的项目数?

r - 使用 dplyr 按最后一列对数据框进行排序

r - 如何为集群解决方案中的单个集群生成序列频率图

r - 计算 R 中的二维样条曲线

r - 如何避免在函数中重复代码以使用ggplot2绘制密度直方图和简单直方图?

r - 在同一个变异函数 dplyr 中使用滞后结果

r - 有没有办法在 ggplot 的 geom_image 中添加 alpha 值?