问题来源
Encoder-Decoder模型可以根据Encoder产生的信息ccc来作为Decoder的input来进行机器翻译,ccc是通过Encoder计算出来的,包含了被翻译内容的所有信息。但是通常某个词的翻译只和被翻译内容的一部分信息有关,比如“我爱做饭。”,翻译成”I love cooking.”,cooking的翻译只和”做饭”有关。还有其他的例子,比如某个词的翻译依赖于前面某些信息,让机器做一个阅读理解题之类的。对于短句来讲,Attention的有点不明显,但如果句子比较长,语义编
深度学习入门-4(机器翻译,注意力机制和Seq2seq模型,Transformer)一、机器翻译1、机器翻译概念2、数据的处理3、机器翻译组成模块(1)Encoder-Decoder框架(编码器-解码器)(2)Sequence to Sequence模型(3)集束搜索(Beam Search)(ⅰ)简单贪心搜索(greedy search)(ⅱ)维特比算法(ⅲ)维特比算法二、注意力机制框架和Seq2seq模型1、注意力机制的引入2、注意力机制框架3、两个常用的注意力层(1)点积注意力(The d