WordNet 中的意义偏移量是一个 8 位数字,后跟一个 POS 标记。例如,同义词集“dog.n.01”的偏移量是“02084071-n”。我尝试了以下代码:
from nltk.corpus import wordnet as wn
ss = wn.synset('dog.n.01')
offset = str(ss.offset)
print (offset)
但是,我得到了这个输出:
<bound method Synset.offset of Synset('dog.n.01')>
如何获得这种格式的实际偏移量:'02084071-n'?
最佳答案
>>> from nltk.corpus import wordnet as wn
>>> ss = wn.synset('dog.n.01')
>>> offset = str(ss.offset()).zfill(8) + '-' + ss.pos()
>>> offset
u'02084071-n'
关于python - 如何提取 WordNet 同义词集的偏移量以在 Python NLTK 中提供同义词集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31223082/