訓練有兩種,一種是你說的,蒸餾GPT。另一種是DS說的,從其他文件來。
8964,在GPT裏,可是也在其他文件裏。
DS在reason的時候顯示它知道8964,並不意味著8964是GPT來的。隻有你先入為主認為DS是從GPT來的,才會看到8964自然認為8964也是從GPT來的。