我打算用 Python 而不是 Excel 来计算大量数据,但由于我了解 Excel 命令,并且在 Python 中复制它非常困难,所以我陷入了困境。
本质上,我想导入 CSV 文件,识别 C 列的位置,然后对于 A 列中的所有唯一值,将 C 中适用于条件 1990 < x < 2000
的所有值相加。在 B
A,B,C
9,1952,125
2,1994,69
3,1973,72
5,1992,85
1,1994,38
1,1994,95
4,1992,29
8,1984,94
我开始:
import csv
with open('TestCase.txt', 'rb') as csvfile:
reader = csv.reader(csvfile, delimiter=',')
row1 = next(reader)
而不是写多个if
语句,我想创建由 0 和 1 组成的新数组,然后对 C 中的所有值求和。
给定另一个条件,结果将如下所示
1980<x<1989 94
1990<x<2000 316
额外奖励是 A 中唯一值的总数,代表总和
UniqueValues Condition TotalSum
1 1980<x<1989 94
4 1990<x<2000 316
最佳答案
如果您喜欢使用第三方库,可以通过pandas
进行矢量化:
import pandas as pd
# read csv file
df = pd.read_csv('file.csv')
# filter column B, group by A, sum C
res = df.loc[df['B'].between(1990, 2000)]\
.groupby('A')['C'].sum()\
.reset_index()
结果:
A C
0 1 133
1 2 69
2 4 29
3 5 85
关于python - 在 Python 中根据唯一键和条件创建新数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49716841/