自然语言处理NLP星空智能对话机器人系列:NLP on Transformers 101 GavinNLP星空对话机器人Transformer课程片段1:Transformer架构内部的等级化结构及其在NLP中的应用内幕
GavinNLP星空对话机器人Transformer课程片段1Transformer架构内部的等级化结构及其在NLP中的应用内幕:该视频揭示了Transformer架构信息表达有效性的核心原因:Transformer网络的级化结构及其在NLP中的语法、语义等的信息表达能力,对Transformer等级结构的深刻理解,将超过大多数普通人对Transformer的理解。
GavinNLP Transformer数学注意力及可视化
-
Transformer的架构、训练及推理等都是在Bayesian神经网络不确定性数学思维下来完成的。Encoder-Decoder架构、Multi-head注意力机制、Dropout和残差网络等都是Bayesian神经网络的具体实现;基于Transformer各种模型变种及实践也都是基于Bayesian思想指导下来应对数据的不确定性;混合使用各种类型的Embeddings来提供更好Prior信息其实是应用Bayesian思想来集成处理信息表达的不确定性、各种现代NLP比赛中高分的作品也大多