每次循环赋值时的reward和后面加入列表后的reward是同一个实例对象,下次循环时把上次加入列表中的实例对象同时赋值了 需要在循环里每次赋值时创建新的实例,这样每次加入列表的元素实例对象也就不同了: