我正在做一个有关互联网流量分类的机器学习类(class)项目。我已经从 http://wand.net.nz/wits/ 下载了跟踪文件(pcap 格式) 。现在,我想对同一数据集进行监督分类,并将流量分类为 FTP、Mail、HTTP 等。
我想在 Matlab 中进行所有这些流量分类,并使用朴素贝叶斯分类器进行相同的操作。现在,我陷入困境 - 我应该如何在 Matlab 中处理这个 pcap 文件并在训练阶段获取类变量(如 FTP、Mail、HTTP)。
面临的问题:
- 无法将此 pcap 文件转换为人类可读的格式(例如 CSV)。
- 我在 Wireshark 中打开 pcap 文件,并且能够识别痕迹,但我应该如何将其保存为某种格式,以便 Matlab 可以处理它。
任何帮助将不胜感激。
最佳答案
看来您需要将数据预处理为模型可以更好处理的格式。
我之前使用过 C# 库 Pcap.Net 。这可以让您读取离线 PCAP 文件,然后获取和处理 Matlab 模型所需的数据。
读取离线 PCAP 文件的教程可以在 here 找到。 。从那里,您可以获得所需的数据包片段,并根据您正在设计的模型对其进行格式化。
希望这有帮助!
关于machine-learning - 在 MATLAB 中使用朴素贝叶斯分类器进行互联网流量分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26074021/