蒸餾是指從用大模型比如DeepSeek R1去訓練參數少的小模型,從而得到8B,14B,32B等等對資源要求較少的版本。

請您先登陸,再發跟帖!