r - 如何从R中的一列中提取部分ID特征

标签 r export-to-csv data-extraction data-processing

我有大约 10,000 行的数据,如下所示:

HH_ID         DEMAND
201101010000  35090
201101010030  35612
201101010100  35245
201101010130  34161
201101010200  33156
201101010230  32556
...           ...

其中 HH_ID 指的是半小时 ID,例如 201101010230 指的是 Year2011、Data0101 和时间 0230。

我想从 HH_ID 中提取年份和日期,并获得如下数据:

HH_ID         Year_ID  Date_ID    DEMAND
201101010000    2011    0101       35090
201101010030    2011    0101       35612
201101010100    2011    0101       35245
201101010130    2011    0101       34161
...           ...

有人知道怎么做吗?

最佳答案

我们可以使用子字符串

Year_ID <- substring(df1$HH_ID, 1, 4)
Date_ID <-  substring(df1$HH_ID, 5, 8)
cbind(df1[1], Year_ID, Date_ID, df1[2])
#         HH_ID Year_ID Date_ID DEMAND
#1 201101010000    2011    0101  35090
#2 201101010030    2011    0101  35612
#3 201101010100    2011    0101  35245
#4 201101010130    2011    0101  34161
#5 201101010200    2011    0101  33156
#6 201101010230    2011    0101  32556

或者另一个选项是 subread.table

cbind(df1, read.csv(text=sub("(.{4})(.{4}).*", "\\1,\\2", df1$HH_ID), 
  col.names = c("Year_ID", "Date_ID"), 
   colClasses = c("numeric", "character"), header=FALSE))

关于r - 如何从R中的一列中提取部分ID特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38149590/

相关文章:

mysql - 通过 MySQL 创建 CSV 文件 - 有任何限制吗?

python - 从字符串中删除 r n r n

javascript - 从任何给定元素中提取 CSS 规则

r - 如何将数据文件的某些行读入 R

c++ - 如何在 Visual Studio 2015 C++ 项目调试期间将变量值更改记录到 CSV 文件?

r - ggpubr的compare_means和base R的pairwise.t.test给出了不同的结果

json - JQ:从聚合的 json 中创建 CSV

python - 从包含标题和分隔符的文本文件中提取列

r - 拟合经过 r 中指定坐标的功率曲线

Python 等效于用 mu 参数化的 R 的 rnbinom