大模型（LLMs）基础面

Encoder-Decoder：
- 在输入上采用双向注意力，对问题的编码理解更充分
- 适用任务：在偏理解的NLP任务上效果好
- 缺点：在长文本生成任务上效果差，训练效率低
causal Decoder：
- 自回归语义模型，预训练和下游应用是完全一致的，严格遵守 只有后面的token才能看到前面的token的规则
- 适用于任务：文本生成任务效果好
- 优点：训练效率高，zero-shot能力更强，具有涌现能力
prefix Decoder：
- 特点：prefix部分的token互相能看到 ，causal Decoder 和 Encoder-Decoder 折中
- 缺点：训练效率低