目录
1、动机
2、理解
3、使用
1、动机最开始是在论文中有看到别人使用,然后就很好奇到底是干啥用的?经过了解,在论文中一般大家都是计算多个run后的均值和标准差和base模型间的p值来判断提升性能的显著性(小于0.05才说明好)
2、理解T检验主要通过样本均值的差异进行检验,统计学上以“总体间没差别”计算显著性水平H0,拒绝原假设H0的最小显著性水平称为检验的p值,来检验假设的结果。例如,假设一个班上男女生的成绩不存在差异,显著性水平为0.05,可理解为只有5%的概率会出现“男女生差异显著”的情况,计算出的检验p值若小于0.05,则可以通过原假设。反之拒绝原假设。
也就是说p值小于0.05的话则说明效果好。大于0.05说明链各个分布几