python - 基于python列表中的另一个变量(使唯一)对变量中的条目求和

标签 python arrays csv count bigdata

我有一个关于如何在 python 中执行此任务的问题:-

我有一个条目数组,例如: [IP 地址、连接、策略状态、事件标志、经度、纬度](均为字符串)

例如

['172.1.21.26','54','1','2','31.15424','12.54464']
['172.1.21.27','12','2','4','31.15424','12.54464']
['172.1.27.34','40','1','1','-40.15474','-54.21454']
['172.1.2.45','32','1','1','-40.15474','-54.21454']

... 直到大约 110000 个条目,大约 4000 种不同的经纬度组合

我想计算每个位置的平均连接数、平均策略状态、平均事件标志

像这样:

[longitude,latitude,avgConn,avgPoli,avgActi]
['31.15424','12.54464','33','2','3']
['-40.15474','-54.21454','31','1','1']

... 等等

我有大约 195 个文件,每个文件大约有 110,000 个条目(有点像大数据问题) 我的文件在 .csv 中,但我将它用作 .txt 以便在 python 中轻松使用它(不确定这是否是最好的主意)

我对 python 还是个新手,所以我不确定什么是最好的使用方法,但我真诚地感谢对这个问题的任何帮助或指导

提前致谢!

最佳答案

不,如果你有 .csv 格式的文件,将它们作为文本威胁是没有意义的,因为 python 附带了出色的 csv 模块。 您可以将 csv 行读入 dict 以对它们进行分组,但我建议将数据写入适当的数据库,并使用 SQL 的 AVG()分组依据。 Python 附带了大多数数据库的绑定(bind)。如果没有安装,请考虑使用 sqlite 模块。

关于python - 基于python列表中的另一个变量(使唯一)对变量中的条目求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10258602/

相关文章:

python - 使用 csv 文件,查找温度平均值

arrays - Matlab:连接两个元胞数组或结构

mysql - 如何将 CSV 文件与 MySQL 列名映射?

python "show in finder"

python - 使用 Python 将所有文件从一个目录 move 到另一个目录

javascript - 如何在 for 循环内将新项目附加到同一数组中的同一索引

c++ - 如何显示大于某个值的数字?

python - 在Hive中以不同的结构导入多个文件

python - 在字典中查找重复值并仅在具有相同键的值不同时才打印它们

python - django 消息不显示