python - csv 数据操作以保持和比较每个类的大

标签 python python-2.7 csv

我正在尝试更改一段代码以执行以下操作。

在每个数据类(column1)中将重量转换为磅。计算每个数据类的最大权重。并且对于数据类的每一行,计算分配给该行中的人的权重与他们的类(dataclass)中最大的权重之间的差异,并将其附加到新列。

这可能是一个相对简单的操作,但我不知道如何在内存中为每个数据类保留每个较大的权重。我的代码可以将重量转换为磅,但这要简单得多,因为我可以直接逐行循环遍历 csv,不需要记住数据类的先前数据。

一个示例 csv 数据集:

data,dataclass1,8-10,data,data
data,dataclass1,9-06,data,data
data,dataclass1,10-00,data,data
data,dataclass1,14-10,data,data
data,dataclass1,12-10,data,data
data,dataclass1,8-11,data,data
data,dataclass1,16-10,data,data
data,dataclass1,20-10,data,data
data,dataclass1,18-10,data,data
data,dataclass2,20-10,data,data
data,dataclass2,8-10,data,data
data,dataclass2,9-06,data,data
data,dataclass2,10-00,data,data
data,dataclass2,14-10,data,data
data,dataclass2,12-10,data,data
data,dataclass2,18-10,data,data
data,dataclass2,8-11,data,data
data,dataclass2,10-00,data,data
data,dataclass2,14-10,data,data
data,dataclass2,12-10,data,data
data,dataclass3,12-10,data,data
data,dataclass3,18-10,data,data
data,dataclass3,8-11,data,data
data,dataclass3,10-00,data,data
data,dataclass3,14-10,data,data
data,dataclass3,12-10,data,data
data,dataclass3,18-10,data,data
data,dataclass3,8-11,data,data
data,dataclass3,10-00,data,data
data,dataclass3,14-10,data,data

我必须将带连字符的重量转换为磅的代码:

import csv

with open('sample.csv') as f:
    with open('new_file.txt', 'w') as w:
        c = [r for r in csv.reader(f, delimiter=',')]
        data = [
            item[0] * 14 + item[1] for item in
                [map(int, row[2].split('-', 1)) for row in c]
        ]
        for line, d in zip(c, data):
            for l in line:
                w.writelines(str(l) + ',')
            w.writelines(str(d))
            w.writelines('\n')

最佳答案

你可以很容易地使用字典。

weightDict = dict()
for line in open("filename").readlines():
    items=line.split(",")
    c = items[1]
    if c not in weightDict.keys():
        weightDict[c] = []
    weightDict[c].append(convertToPounds(items[2])) #call your conversion function here

for c in weightDict.keys(): #loop over all classes seen
    print("class: " + c + "max: " + str(max(weightDict[c])) #calls max function on all weights for this class

此函数打印类及其最大权重,但您可以编写它们或通过修改最后一个循环来做任何您喜欢的事情。

关于python - csv 数据操作以保持和比较每个类的大,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19969008/

相关文章:

matlab - 数字大于 7 位的 Csvwrite

mysql - 使用另一个表 MySQL 中的相应值更新多行

python - 使用 boost-python 将 python 变量设置为 C++ 对象指针

python - 如何向 Windows 通知气球添加换行符?

python - Pandas:将一列列名转换为一列值

Python:更改导入字典中的值没有效果

python - 在 Pybrain 中创建共享权重连接

Python 尝试在按数字排序后按字母顺序对列表进行排序

Python 日志记录 - 使用根记录器在多个模块中配置文件

c# - 正则表达式用于删除逗号周围的空格(引用时除外)