我有一个关于如何在 python 中执行此任务的问题:-
我有一个条目数组,例如: [IP 地址、连接、策略状态、事件标志、经度、纬度](均为字符串)
例如
['172.1.21.26','54','1','2','31.15424','12.54464']
['172.1.21.27','12','2','4','31.15424','12.54464']
['172.1.27.34','40','1','1','-40.15474','-54.21454']
['172.1.2.45','32','1','1','-40.15474','-54.21454']
... 直到大约 110000 个条目,大约 4000 种不同的经纬度组合
我想计算每个位置的平均连接数、平均策略状态、平均事件标志
像这样:
[longitude,latitude,avgConn,avgPoli,avgActi]
['31.15424','12.54464','33','2','3']
['-40.15474','-54.21454','31','1','1']
... 等等
我有大约 195 个文件,每个文件大约有 110,000 个条目(有点像大数据问题) 我的文件在 .csv 中,但我将它用作 .txt 以便在 python 中轻松使用它(不确定这是否是最好的主意)
我对 python 还是个新手,所以我不确定什么是最好的使用方法,但我真诚地感谢对这个问题的任何帮助或指导
提前致谢!
最佳答案
不,如果你有 .csv 格式的文件,将它们作为文本威胁是没有意义的,因为 python 附带了出色的 csv
模块。
您可以将 csv 行读入 dict
以对它们进行分组,但我建议将数据写入适当的数据库,并使用 SQL 的 AVG()
和 分组依据
。 Python 附带了大多数数据库的绑定(bind)。如果没有安装,请考虑使用 sqlite
模块。
关于python - 基于python列表中的另一个变量(使唯一)对变量中的条目求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10258602/