https://zhuanlan.zhihu.com/p/147310766 整理了12小时,只为让你20分钟搞懂Seq2seq 挺易懂的
https://zhuanlan.zhihu.com/p/51383402 完全解析RNN, Seq2Seq, Attention注意力机制
https://zhuanlan.zhihu.com/p/46040939 草稿纸上的seq2seq模型与Attention机制
https://zhuanlan.zhihu.com/p/60127009 图解-基于Attention的Seq2Seq模型
https://www.zhihu.com/question/445556653 如何最简单、通俗地理解Transformer。 (大模型必须知道 Transformer)
https://mp.weixin.qq.com/s/o__YU5vlfKi4HGytlug3og 赛尔译文 | 从头开始了解Transformer