python - Pandas:计算分组在一起的相似列的平均值、var

尝试使用 pandas 对网络跟踪数据进行分析。我已读取转储文件并创建了以下 DataFrame:

因此，为了检测 DataFrame data2 中的各个流，我根据 ['ip_src' 对整个 DataFrame 进行了分组, 'ip_dst', 'sport', 'dport', 'ip_proto', 'service'] 使用以下代码:

flow = ['ip_src', 'ip_dst', 'sport', 'dport', 'ip_proto', 'service']
grp1 = data2.groupby(flow, sort=False)

因此，当我对 data2 的前二十行执行 grp1.size() 时，我得到以下信息:

我现在想做的是计算ip_len、packet_len、var的mean数据包间到达时间的 ip_len、packet_len 和 mean(使用属于同一流的数据包的时间戳) .

如何在 pandas 中完成此操作，以便我获得的数据帧包含每个流的统计信息，即列应包含 ip_src、ip_dst、sport 、dport、ip_proto、service 以及之前计算的平均值和 var 值。我已经尝试了 aggr 和 apply 方法，但无法做到这一点。提前致谢!

最佳答案

data2.groupby(['colName1','colName2']).mean()

应该可以完成这项工作。

关于python - Pandas:计算分组在一起的相似列的平均值、var，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31682966/

上一篇：python - 我可以将 Datanitro 集成到可执行文件中吗？

下一篇：python - python中进程间传递数据

相关文章：

python - 如何使用Scrapy抓取所有URL？

android - 将原始数据包发送到 Android 中的 NetworkInterface 不起作用？

networking - 环回地址的真实示例

sorting - Pandas DataFrame 排序 : Want to sum and sort, 但保留列名

python - Pandas:通过直方图结果索引数据

python - 解析 X-Forwarded-For 以在 Heroku 上使用 werkzeug 获取 ip

python - 迭代器 python

python - 在 Python 中使用 BeautifulSoup 识别和替换 XML 元素

python - 除了 : and except Exception as e: 之间的区别

python - 用于具有预定义列表的多列的 pandas get_dummies()