machine-learning - 在 MATLAB 中使用朴素贝叶斯分类器进行互联网流量分类

标签 machine-learning pcap

我正在做一个有关互联网流量分类的机器学习类(class)项目。我已经从 http://wand.net.nz/wits/ 下载了跟踪文件(pcap 格式) 。现在,我想对同一数据集进行监督分类,并将流量分类为 FTP、Mail、HTTP 等。

我想在 Matlab 中进行所有这些流量分类,并使用朴素贝叶斯分类器进行相同的操作。现在,我陷入困境 - 我应该如何在 Matlab 中处理这个 pcap 文件并在训练阶段获取类变量(如 FTP、Mail、HTTP)。

面临的问题:

  1. 无法将此 pcap 文件转换为人类可读的格式(例如 CSV)。
  2. 我在 Wireshark 中打开 pcap 文件,并且能够识别痕迹,但我应该如何将其保存为某种格式,以便 Matlab 可以处理它。

任何帮助将不胜感激。

最佳答案

看来您需要将数据预处理为模型可以更好处理的格式。

我之前使用过 C# 库 Pcap.Net 。这可以让您读取离线 PCAP 文件,然后获取和处理 Matlab 模型所需的数据。

读取离线 PCAP 文件的教程可以在 here 找到。 。从那里,您可以获得所需的数据包片段,并根据您正在设计的模型对其进行格式化。

希望这有帮助!

关于machine-learning - 在 MATLAB 中使用朴素贝叶斯分类器进行互联网流量分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26074021/

相关文章:

machine-learning - 谷歌的 tesseract-OCR 识别使用哪种算法?

optimization - 寻找想法/引用/关键字 : adaptive-parameter-control of a search algorithm (online-learning)

tensorflow keras嵌入LSTM

node.js - windows下用nodejs抓包

pcap - 数据包数据拦截和修改

python - 如何使用 Python 找到 Wally?

machine-learning - Chainer如何保存和加载DQN模型

ssl - 解密来自 PCAP 的 TLS 流量

c++ - 如何解析 TCP 数据包负载

c - pcap 为什么总是 8 字节的数据包...为什么?