2023-11-2组会摘要02

大模型介绍

常见误解:

大模型给出的回答是否是提前设计好的?

大模型给出的回答是否是网络上搜索的?

大模型结构:

大模型一般是通过输入编码、嵌入层、自注意机制和反向传播来将输入转变为输出。

大模型流程:

大模型训练的主要流程是预训练、督导式学习、强化学习来完成的。目前大多数应用可以基于原本模型进行微调。