Task03:过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶(1天)
梯度消失部分,主要是协变量偏移、标签偏移、概念偏移三个概念,第一次接触;
循环神经网络以及过拟合部分比较容易理解;
Task04:机器翻译及相关技术;注意力机制与Seq2seq模型;Transformer(1天)
第一次接触encoder-decoder两个概念,自动翻译的核心,就是先将一句话编码,然后通过解码,得到新的语言,听起来很玄,nlp还是要复杂很多的;
注意力机制,本质上是提取一段字符内值得注意的概