r - R 中缺失数据的某些模式

数据框由 5 个变量组成:

> head(list_outdegrees, 5)
             Name OUTdegrees Followers Friends Statuses
1          Case_1         11     44423    4053    34518
2          Case_2         35         0       0        0
3          Case_3         13     41775     404   279384
4          Case_4         20     91952       0   108603
5          Case_5         13     31886    2885     4847

我最近asked在这个网站上如何使 R 中的零缺失，并被告知使用 na.strings 如 read.csv("filename.csv", na.strings="0") 。这很有效，但这并不完全是我所需要的，因为有时零是我的情况下的实际数据。

在上面的示例中，Case_2 缺少数据，因为 Followers、Friends 和 Statuses 变量是全为零。然而，在 Case_4 的情况下，零是实际的数据。

因此，仅当案例的三个变量(Followers、Friends 和 Statuses)为零时才会出现数据缺失。此外，无论是否缺少数据，OUT Degrees 始终具有一个值。

当且仅当Followers、Friends和Statuses是时，是否可以告诉R删除(或忽略)案例全为零？

最佳答案

您可以使用子集函数:

subset(list_outdegrees,Followers!=0 | Friends!=0 | Statuses!=0)

关于r - R 中缺失数据的某些模式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27465130/

上一篇：regex - 正则表达式用?

下一篇：c# - LINQ - 选择最小计数

相关文章：

python - 当且仅当特定列的值缺失时如何删除行？

r - 使用 rmarkdown 和knitr 将部分添加到投影仪演示文稿中

r - 在R中的字符串中添加双引号

r - 如何将R ggplot图形存储为html代码段

缺少类别的 R 包插入符号混淆矩阵

python - 用回归填充 NaN 值

r - 在 R 中解析 = 运算符不会产生语言对象

r - 通过多列更广泛地旋转

python - Pandas - 用相应的 id 列值填充缺失的列值

python - Pandas 索引缺失值