我已经用 Bertopic 构建了一个主题模型。 获得主题后,我如何将它们分配给数据集。
我的主要目标是将无监督主题建模转换为有监督多标签分类问题。
最佳答案
您可以直接使用数据框中的原始数据集编写主题,因为主题的输出顺序与文档中包含的顺序相同。
import pandas as pd
model = BERTopic.load('path')
df = pd.DataFrame({ 'topic': model.topics_,'document': docs['id']})
关于python - Bertopic 将主题分配给数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74151249/