Transformer课程 第25章:阅读理解MRC模型集成、蒸馏、部署及源码实现 1,模型集成ensemble有效性背后的Bayesian数学原理深度剖析 2,模型扰动造成的方差数学原理剖析 3,方差与normalization 4,基于投票思想的模型集成方法及其在多选题和完形填空中的应用 5,基于bagging思想的模型集成方法 6,基于boosting思想的集成方法 7,基于stacking思想的模型集成方法 8,Blending机制 9,阅读理解中的模型ensemble:BERT + Linguistic Knowledge + Ensemble Algorithm 10,用小模型去学习大模型的预测结果及泛化能力 11,Teacher model - distilled model架构解析 12,soft labels、hard label 13,soft predictions、hard prediction 14,信息对齐:样本、中间结果、网络结构 15,DistillBERT用于Knowledge Distillation 16,server framework + deep learning framework API 17,server framework + deep learning serving 18,modeling完整代码解析 19,data utils源码解析 20,model utils源码解析 21,classifier utils源码解析 22,classifier源码解析 2
Transformer课程 第25章:阅读理解MRC模型集成、蒸馏、部署及源码实现
关注
打赏