r - 字符向量到数据框

标签 r dataframe

我有以下格式的数据。向量的第一个元素指的是标题,向量的第二个元素到底部指的是针对标题的值。我想以表格/结构化格式(或带有标题和值的数据框)放置数据。

k <- c("Afv.dato : Type Termin lalt Betalt pa termin Terminsbelgb", "13-09-2019 opkrzvning 11-09-2019 4.067,11",
  "18-10-2019 indbetaling 4.067,00 11-09-2019 4.067,00", "11-12-2019 opkrzvning 11-12-2019 9.176,00" ,
  "18-12-2019 indbetaling 9.176,11 11-09-2019 0,11", "11-12-2019 9.176,00", "11-03-2020 opkreevning 11-03-2020 9.176,00", 
  "02-03-2020 indbetaling 9.176,00 11-03-2020 9.176,00", "11-06-2020 opkraevning 11-06-2020 9.176,00",
  "18-05-2020 indbetaling 9,176,00 11-06-2020 9.176,00"         
)

所需输出(前 5 行的值(包括标题) enter image description here

最佳答案

您可以使用strcapture尝试一下。

strcapture("(\\d+-\\d+-\\d+) *(\\D*) *(\\d+-\\d+-\\d+)* *([0-9.,]*) *(\\d+-\\d+-\\d+)* *([0-9.,]*)",
 k[-1], data.frame(Afv.dato=character(), Type=character(), Termin=character(),
 lalt=character(), "Betalt pa termin"=character(), Terminsbelgb=character()))
#    Afv.dato         Type     Termin     lalt Betalt.pa.termin Terminsbelgb
#1 13-09-2019  opkrzvning  11-09-2019 4.067,11                              
#2 18-10-2019 indbetaling             4.067,00       11-09-2019     4.067,00
#3 11-12-2019  opkrzvning  11-12-2019 9.176,00                              
#4 18-12-2019 indbetaling             9.176,11       11-09-2019         0,11
#5 11-12-2019                         9.176,00                              
#6 11-03-2020 opkreevning  11-03-2020 9.176,00                              
#7 02-03-2020 indbetaling             9.176,00       11-03-2020     9.176,00
#8 11-06-2020 opkraevning  11-06-2020 9.176,00                              
#9 18-05-2020 indbetaling             9,176,00       11-06-2020     9.176,00

关于r - 字符向量到数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63578858/

相关文章:

从 R : Unexpected token in expression or statement 运行 powershell 命令

python - 如何从数据框中创建一个列表,其中包含字符串列的每个值乘以第二列?

python - 如果我想根据旧列范围创建新列?

python-2.7 - 在 Python Pandas 中将此 Word DataFrame 转换为零一矩阵格式 DataFrame

python - 我是否需要遍历每一行数据来计算每个列类别的时间?

r - 更改 R 中的一列名称

r - 改变 R 中的重要性符号

使用 lm() 和 predict() 进行滚动回归和预测

r - 在 R 中,为什么我会在 POSIXct 和 POSIXlt 之间获得一毫秒的差异?

python - 将字符串中的每个单词读入 pandas 新行