python - 使用机器学习解码回溯

标签 python machine-learning data-science tf-idf traceback

我正在尝试解决一个问题,每当发生崩溃时(在 Linux 世界中)我都有包含解码回溯(堆栈调用跟踪)的文件,并且我有一个唯一的 ID 来跟踪每次发生的崩溃。

我想构建一个分类器,它将从之前的解码回溯中学习并预测是否存在当前回溯的 ID。

这是我的第一个机器学习项目。我使用机器学习并在 Python 中使用 CountVectorizer 和 TF-IDF 方法进行了试验。

我想知道分类要考虑哪些特征,以及适合文本分类的算法来解决这个问题。

最佳答案

很高兴听到这是您的第一个机器学习项目!对于我的第一个 NLP,我使用经过审查的亚马逊产品来完成它。你试试词袋(BOW)模型吗?你也可以试试 N-gram。您可以考虑使用 NaiveBayes Classifier 并评估您的分类。然后你就会知道哪个会给你解决问题的最佳算法。

额外阅读(如果你喜欢):https://machinelearningmastery.com/encoder-decoder-models-text-summarization-keras/

关于python - 使用机器学习解码回溯,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45136300/

相关文章:

python - 常量 Flask session ID

python - 检查 shell 命令是否已成功执行的最佳方法

python - 当我们使用transform得到相同的输出时,为什么我们应该使用fit_transform方法

python - 在特定字符串后匹配重复模式

python - Azure函数应用程序-输出CosmosDB

python - 如何将复杂的Excel表格数据转换为结构化数据?

machine-learning - TensorBoard - 在同一张图上绘制训练和验证损失?

python - scikit-learn 中是否有任何类型的子空间聚类包可用

python - 在 Python 中读取 SQL 表

python - 使用滑动窗口评估文本分组的情绪