Python解析然后放入数据框

标签 python pandas dataframe

我有一个包含如下数据的文件:

------------------------------
------------------------------
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10>

------
++++++
%%RequestHandler
    DATA1 = 123456
    ERROR1 = 500
    DATA2 = 56789
    ERROR2 = 505

Count = 4
---

我想创建一个像这样的数据框

<表类=“s-表”> <标题> 数据1 错误1 <正文> 123456 500 56789 505

最佳答案

使用 pivot 的另一种正则表达式方法:

import re

                                                         # or file.read()
out = (pd.DataFrame(re.findall(r'^\s+(\w+)(\d+) = (\d+)', text, flags=re.M))
         .pivot(index=1, columns=0, values=2)
         .rename_axis(index=None, columns=None)
      )

print(out)

输出:

     DATA ERROR
1  123456   500
2   56789   505

使用的输入:

text = '''------------------------------
------------------------------
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10> 
<TIME:2020-01-01 01:25:10>

------
++++++
%%RequestHandler
    DATA1 = 123456
    ERROR1 = 500
    DATA2 = 56789
    ERROR2 = 505

Count = 4'''

regex demo

关于Python解析然后放入数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76670562/

相关文章:

python - 如何在没有高级集合的情况下删除某个字母的所有出现? (Python)

python - 如何通过 Python 获取特定类别的平均值

pandas - Seaborn:按升序排序计数图

python - 如何获取 pandas DataFrame 的最后 N 行?

python - 多索引数据的堆积图

python - 为什么 pandas unstack 会抛出错误?

python - 如何使用 virtualenv 在 Windows 中使用 32 位和 64 位 Python?

python - 是否可以在 Python 中创建匿名对象?

python - 使用当前路径从终端打开 Pycharm

python : Create a dataframe from existing pandas dataframe