您当前的位置: 首页 >  ar

Dream丶Killer

暂无认证

  • 0浏览

    0关注

    188博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

UserWarning: [W008] Evaluating Doc.similarity based on empty vectors.

Dream丶Killer 发布时间:2021-04-15 15:23:01 ,浏览量:0

使用spacy计算两个token的相似性时,出现标题的警告。

similar_word.similarity(token)

UserWarning: [W008] Evaluating Doc.similarity based on empty vectors.

报错原因:当similar_word不是一个有效的spacy doc时,则会出现如下报错。 栗子

import spacy

nlp = spacy.load('en_core_web_md')
tokens = nlp(u'apple banana')

similar_word = nlp(u'')
for token in tokens:
  print(token.text, similar_word.similarity(token))


similar_word = nlp(u'pear')
for token in tokens:
  print(token.text, similar_word.similarity(token))
  
# 运行结果
apple 0.0
banana 0.0
UserWarning: [W008] Evaluating Doc.similarity based on empty vectors.
UserWarning: [W008] Evaluating Doc.similarity based on empty vectors.

apple 0.5968762355521726
banana 0.6300500965184214

解决方式: 在调用 similarity()之前检查相似的单词是否有效,包括是否有一个有效的单词向量。

import spacy

nlp = spacy.load('en_core_web_md')
tokens = nlp(u'apple banana')

similar_word = nlp(u'')
if(similar_word and similar_word.vector_norm):
  for token in tokens:
    if(token and token.vector_norm):
        print(token.text, similar_word.similarity(token))

# 运行结果
无输出
关注
打赏
1655344294
查看更多评论
立即登录/注册

微信扫码登录

0.0377s