点积注意力(Scaled dot product attention)

Transformer 使用的注意力函数有三个输入:Q(请求(query))、K(主键(key))、V(数值(value))。用于计算注意力权重的等式为:
A t t e n t i o n ( Q ,
Transformer 使用的注意力函数有三个输入:Q(请求(query))、K(主键(key))、V(数值(value))。用于计算注意力权重的等式为:
A t t e n t i o n ( Q ,
微信扫码登录