python - pyLDAvis 对于 lambda = 0 的条宽的含义

标签 python lda topic-modeling

不确定这是否是正确的论坛,但我想知道是否有人了解当 lambda = 0 时如何解释 pyLDAvis 图右侧的红色和蓝色条的宽度(参见 http://www.kennyshirley.com/LDAvis/#topic=0&lambda=0.01&term= 演示,例如示例)。我知道当 lambda = 1 时,红色条表示给定主题中术语的计数,灰色条表示语料库中整体相同术语的计数。我不明白当 lambda = 0 时显示什么以及为什么条形似乎不再以任何方式排序。你能帮忙吗?

最佳答案

简单来说:

  • 非常接近于零的 lambda 值将显示更多 的项具体 对于 选择主题 .这意味着您将看到对特定主题“重要”但不一定对整个语料库“重要”的术语。
  • 非常接近 1 的 lambda 值将显示那些具有最高 的项。比率该术语的频率之间 专题以及来自 的术语的总频率语料库 .

  • 您可以在此处找到有关 lambda 和 LDAvis 的更多信息:LDAvis: A method for visualizing and interpreting topics

    关于python - pyLDAvis 对于 lambda = 0 的条宽的含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50726713/

    相关文章:

    python - Opencv python 中的 LDA

    r - 如何将多个 pdf 文件转换为一个语料库以在 R 中进行文本分析?

    python - 获得两个全文文档之间相似度度量的方法?

    python-3.x - 如何解释 LDA 组件(使用 sklearn)?

    python - 使用 BeautifulSoup 解析 <style> 标签内的 html 注释

    python - 如何在 python 中拆分非常长的正则表达式

    python-2.7 - 导入错误 : cannot import name corpora with Gensim

    python - 在 pyjade 中使用 python 代码

    在 docker 容器内运行的 Python 程序依赖于 'uname -r'

    scala - 带 Spark 的 LDA 模型