根据维基百科,ROUGE-SU 指标的定义如下:
ROUGE-SU:跳过二元语法加上基于一元语法的共现统计。
我的问题是,该指标的精确公式是什么?ROUGE-SU 指标背后的直觉是什么?
提前谢谢您。
最佳答案
S 表示跳过二元组。它意味着匹配 2 个不连续的单词(即之间有其他单词),从而允许重新措辞和句子重组。由于 ROUGE 分数应该评估自动摘要,因此这是一个好点。
U 表示一元语法,即 1-gram,= 计算常见单词
因此SU意味着我们同时计算skip-bigram和unigram。关键是要制作一个软跳过二元组,因为我们可能不想仅仅因为一个句子在具有共同的一元组时不共享跳过二元组而给它分配 0 分。
你明白了吗?
无论如何,请注意,ROUGE 分数本身并不完美。您总是应该获得几个显示不同特征的值。
希望这有帮助
pltrdy
作为旁注,我开发了一个脚本来计算 2 个文件之间的 ROUGE 分数。在这里找到它:https://github.com/pltrdy/files2rouge
关于text - ROUGE-SU 度量、含义和公式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41808030/