r - 如何替换列值以进行同类群组分析

标签 r analysis

我对使用 R 很陌生。我已经搜索过这个,但找不到任何指针。

我正在进行群组分析,Month1 下的数据是该特定月份注册的新用户数量。 Month2 是从上个月注册开始的用户数。

我有一组数据如下

Month_Start_Date   Month1   Month2   Month3  Month4   Month5   Month6
2010-01-01           10        12       11      9       3        15
2010-02-01           10         9       11      9       3        15
2010-03-01           10         9        7      9       3        15
2010-04-01           10         7        5      6       3        15
2010-05-01           10         8        6      3       4        15

我希望我的数据采用以下格式:
Month_Start_Date   Month1   Month2   Month3  Month4   Month5   Month6
2010-01-01           10         0       0       0       0        0
2010-02-01           10         9       0       0       0        0
2010-03-01           10         9       7       0       0        0
2010-04-01           10         7       5       6       0        0
2010-05-01           10         8       6       3       4        0

我的主要数据有 2008 年的数据。我过滤只从 2010 年开始。因此,我希望 2010-01-01 的 Month2、Month3、Month4、Month5 为 0,2010-02 的 Month3、Month4、Month5 为 0 -01

最佳答案

好像你想要 upper.tri将值设置为零。从...开始

> df
#   Month_Start_Date Month1 Month2 Month3 Month4 Month5 Month6
# 1       2010-01-01     10     12     11      9      3     15
# 2       2010-02-01     10      9     11      9      3     15
# 3       2010-03-01     10      9      7      9      3     15
# 4       2010-04-01     10      7      5      6      3     15
# 5       2010-05-01     10      8      6      3      4     15

我们可以用零替换上三角形
> df[-1][upper.tri(df[-1])] <- 0
> df
#   Month_Start_Date Month1 Month2 Month3 Month4 Month5 Month6
# 1       2010-01-01     10      0      0      0      0      0
# 2       2010-02-01     10      9      0      0      0      0
# 3       2010-03-01     10      9      7      0      0      0
# 4       2010-04-01     10      7      5      6      0      0
# 5       2010-05-01     10      8      6      3      4      0

关于r - 如何替换列值以进行同类群组分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25857769/

相关文章:

c++ - 有效但没有多大意义的返回语句

python - 从 SQL 数据库中的 OHLC 数据中选择 7、14、20、50、200 天的价格。

r - 与唯一的 observeEvent 相关联的 actionButton 的动态数量

arrays - R 数组分配中的内存使用情况

analysis - 调试和分析木马

algorithm - 嵌套几何序列的复杂性

java - 如何分析下面代码的增长?

r - 在 ggplot 中设置黄土线置信区间阴影的限制

r - Switch 语句不适用于数字对象

r - 边缘化 Stan 中缺失的离散响应数据