python - Pandas:计算分组在一起的相似列的平均值、var

标签 python pandas ip

尝试使用 pandas 对网络跟踪数据进行分析。我已读取转储文件并创建了以下 DataFrame: Dataframe

因此,为了检测 DataFrame data2 中的各个流,我根据 ['ip_src' 对整个 DataFrame 进行了分组, 'ip_dst', 'sport', 'dport', 'ip_proto', 'service'] 使用以下代码:

flow = ['ip_src', 'ip_dst', 'sport', 'dport', 'ip_proto', 'service']
grp1 = data2.groupby(flow, sort=False)

因此,当我对 data2 的前二十行执行 grp1.size() 时,我得到以下信息:

Grouping

我现在想做的是计算ip_lenpacket_lenvarmean数据包间到达时间的 ip_lenpacket_lenmean(使用属于同一流的数据包的时间戳) .

如何在 pandas 中完成此操作,以便我获得的数据帧包含每个流的统计信息,即列应包含 ip_srcip_dstsport dportip_protoservice 以及之前计算的平均值和 var 值。我已经尝试了 aggrapply 方法,但无法做到这一点。提前致谢!

最佳答案

data2.groupby(['colName1','colName2']).mean() 

应该可以完成这项工作。

关于python - Pandas:计算分组在一起的相似列的平均值、var,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31682966/

相关文章:

python - 如何使用Scrapy抓取所有URL?

android - 将原始数据包发送到 Android 中的 NetworkInterface 不起作用?

networking - 环回地址的真实示例

sorting - Pandas DataFrame 排序 : Want to sum and sort, 但保留列名

python - Pandas:通过直方图结果索引数据

python - 解析 X-Forwarded-For 以在 Heroku 上使用 werkzeug 获取 ip

python - 迭代器 python

python - 在 Python 中使用 BeautifulSoup 识别和替换 XML 元素

python - 除了 : and except Exception as e: 之间的区别

python - 用于具有预定义列表的多列的 pandas get_dummies()