r - R 中缺失数据的某些模式

标签 r missing-data

数据框由 5 个变量组成:

> head(list_outdegrees, 5)
             Name OUTdegrees Followers Friends Statuses
1          Case_1         11     44423    4053    34518
2          Case_2         35         0       0        0
3          Case_3         13     41775     404   279384
4          Case_4         20     91952       0   108603
5          Case_5         13     31886    2885     4847

我最近asked在这个网站上如何使 R 中的零缺失,并被告知使用 na.stringsread.csv("filename.csv", na.strings="0") 。这很有效,但这并不完全是我所需要的,因为有时零是我的情况下的实际数据。

在上面的示例中,Case_2 缺少数据,因为 FollowersFriendsStatuses 变量是全为零。然而,在 Case_4 的情况下,零是实际的数据。

因此,仅当案例的三个变量(FollowersFriendsStatuses)为零时才会出现数据缺失。此外,无论是否缺少数据,OUT Degrees 始终具有一个值。

当且仅当FollowersFriendsStatuses是时,是否可以告诉R删除(或忽略)案例全为零?

最佳答案

您可以使用子集函数:

subset(list_outdegrees,Followers!=0 | Friends!=0 | Statuses!=0)

关于r - R 中缺失数据的某些模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27465130/

相关文章:

python - 当且仅当特定列的值缺失时如何删除行?

r - 使用 rmarkdown 和knitr 将部分添加到投影仪演示文稿中

r - 在R中的字符串中添加双引号

r - 如何将R ggplot图形存储为html代码段

缺少类别的 R 包插入符号混淆矩阵

python - 用回归填充 NaN 值

r - 在 R 中解析 = 运算符不会产生语言对象

r - 通过多列更广泛地旋转

python - Pandas - 用相应的 id 列值填充缺失的列值

python - Pandas 索引缺失值