第二次打卡内容
Task1 过拟合欠拟合,梯度消失,爆炸,LSTM,GRU
Tsak2 机器翻译,Seq2Seq, Transformer
Task3 卷积神经网络基础和进阶,leNet
过拟合与欠拟合
过拟合:泛化误差高于训练误差,原因是模型过于复杂或者训练数据集比较小。当模型过于复杂时,可以简化模型参数或者加入L2正则化对参数进行惩罚,也可以采用丢弃法泛化误差不会随着训练数据集里的样本数量增加儿增大,所以通常选择大一些的训练数据集。
欠拟合:无法得到较低的训练误差。原因是训练数据集不够或者模