Loss/Loss梯度
Mean Squard Error;MSE—均方差
softmax:
第二个式子要开根号,所以用torch.norm计算的时候,要加上一个pow(2)把平方乘回来
后面那一部分取决于用什么网络结构,对thta求导的地方,取决于选取什么函数
Loss/Loss梯度
Mean Squard Error;MSE—均方差
softmax:
第二个式子要开根号,所以用torch.norm计算的时候,要加上一个pow(2)把平方乘回来
后面那一部分取决于用什么网络结构,对thta求导的地方,取决于选取什么函数