您当前的位置: 首页 > 

段智华

暂无认证

  • 0浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

cs224u WordNet+Glove VSMs +Retrofit

段智华 发布时间:2020-05-03 10:58:30 ,浏览量:0

cs224u WordNet+Glove VSMs +Retrofit

Faruqui等人在三个知识图上进行实验:WordNet、FrameNet和 Penn Paraphrase Database (PPDB)。本文实现其中一个WordNet实验,其中图是基于同义词形成的。

  1. WordNet(https://wordnet.princeton.edu/) 
  • WordNetwordNet 是普林斯顿大学提供的英语语料库。名词、动词、形容词和副词被分成若干组认知同义词(synsets),每一组都表达一个不同的概念。synsets通过概念语义和词汇关系相互联系。WordNet的结构使其成为计算语言学和自然语言处理的有用工具。
  • WordNet类似于一个同义词表,它根据单词的含义将它们组合在一起。然而,有一些重要的区别。首先,WordNet不仅把单词串成字母串,而且把单词的特定意义连接起来,发现彼此接近的单词在语义上消除了歧义。其次,WordNet标记了词之间的语义关系。
  • WordNet中词与词之间的主要关系是同义关系,如 shut与close,car与automobile。同义词表示相同概念并在许多上下文中可互换的词,被分为无序集(synsets)。WordNet的117000个synsets中的每一个都通过少量的“概念关系”链接到其他synsets。此外,一个synsets包含一个简短的定义(gloss),在大多数情况下,还包含一个或多个说明synsets成员使用的短句。具有多种不同含义的单词形式在许多不同的synsets中表示。因此,WordNet中的每个形式-意义对都是唯一的。
  • synsets之间最常见的
关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.0389s