python - 如何将这个Excel文件拆分为两个数据框?

标签 python dataframe

excel spreadsheet

当我尝试将此 Excel 电子表格加载到数据框中时,由于文件中的所有随机空白,我得到了很多 NAN。我真的很想将这个 excel 文件中的 I 类和 A 类拆分为两个单独的 pandas 数据框

在:

pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
excel_file = 'EXAMPLE.xlsx'
df = pd.read_excel(excel_file, header=8)
print(df)
sys.exit()

输出:

               Class I  Unnamed: 1 Unnamed: 2  Unnamed: 3 Unnamed: 4  Unnamed: 5  Unnamed: 6  Unnamed: 7              Class A  Unnamed: 9 Unnamed: 10  Unnamed: 11 Unnamed: 12
0                 Date         NaN   column 1         NaN   column 2         NaN         NaN         NaN                 Date         NaN    column 1          NaN    column 2
1  2019-12-31 00:00:00         NaN          1         NaN          A         NaN         NaN         NaN  2019-12-31 00:00:00         NaN           A          NaN           1
2  2020-01-01 00:00:00         NaN          2         NaN          B         NaN         NaN         NaN  2020-01-01 00:00:00         NaN           B          NaN           2
3  2020-01-02 00:00:00         NaN          3         NaN          C         NaN         NaN         NaN  2020-01-02 00:00:00         NaN           C          NaN           3
4  2020-01-03 00:00:00         NaN          4         NaN          D         NaN         NaN         NaN  2020-01-03 00:00:00         NaN           D          NaN           4
5  2020-01-04 00:00:00         NaN          5         NaN          E         NaN         NaN         NaN  2020-01-04 00:00:00         NaN           E          NaN           5
6  2020-01-05 00:00:00         NaN          6         NaN          F         NaN         NaN         NaN  2020-01-05 00:00:00         NaN           F          NaN           6
7  2020-01-06 00:00:00         NaN          7         NaN          G         NaN         NaN         NaN  2020-01-06 00:00:00         NaN           G          NaN           7
8  2020-01-07 00:00:00         NaN          8         NaN          H         NaN         NaN         NaN  2020-01-07 00:00:00         NaN           H          NaN           8

最佳答案

尝试使用参数usecols。来自文档:

If list of int, then indicates list of column numbers to be parsed.

import pandas as pd
df1 = pd.read_excel(excel_file,usecols=[0,2,4])
df2 = pd.read_excel(excel_file,usecols=[8,10,12])

这应该创建两个包含您想要的列的数据框。

关于python - 如何将这个Excel文件拆分为两个数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63909176/

相关文章:

python - Tensorflow QueueRunner 与 py_func enqueue_op : How to use?

python - 根据条件的最后一次出现划分数据帧

r - 如何反转R中模式中数据帧的顺序

r - 在 R 中将数据从行移动到列中,忽略缺失值并根据转置列添加列

dataframe - 如何在 Number pyspark 或 NLP 之间拆分

python - 将作为另一个列表元素的列表元素从字符串转换为整数

python - 从许多文本文件中快速删除前 n 行

python - MySQL 连接器 - 连接被主机强制关闭

r - 将深度嵌套列表转换为数据框

python - Pandas => 按组获取第一个和最后一个元素的索引