您当前的位置: 首页 > 

段智华

暂无认证

  • 0浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

cs224u Homework  PPMI+ LSA +GloVe+ Dice coefficient + t-test reweighting +subword information 

段智华 发布时间:2020-05-04 21:54:03 ,浏览量:0

cs224u Homework  PPMI+ LSA +GloVe+ Dice coefficient + t-test reweighting +subword information 

本文包括以下内容:

  • PPMI as a baseline
  • Gigaword with LSA at different dimensions
  • Gigaword with GloVe for a small number of iterations
  • Dice coefficient
  • t-test reweighting
  • Enriching a VSM with subword information
  • Your original system
  • Bake-off
PPMI作为基线

PPMI作为任务的基线代码,编写run_giga_ppmi_baseline函数,实现以下操作: 1.在VSM中,读取Gigaword 计数矩阵(窗口大小为20)到pd.DataFrames中。文件是data/vsmdata/giga_window20-flat.csv.gz。 2.用PPMI重新更新计数矩阵的权重。 3.使用full_word_similarity_evaluation函数评估这个重加权矩阵。run_giga_ppmi_baseline的返回值是调用完全相似性评估的返回值。目的是熟悉vsm中的代码和函数full_word_similarity_evaluation。

test_run_giga_ppmi_baseline基线用于测试是否正确实现了此规范。

giga_window20-flat.csv文件(维度5000,选取5000个单词)的部分记录如下:

关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.0454s