最新的Math500模型測試準確率對比

回答: 訓練數據和工藝是低成本的關鍵未完的歌2025-02-07 07:22:34

Qwen2.5-0.5B-Inst.                       76.4 
Qwen2.5-1.5B-Inst.                        81.8 
DeepScaleR-1.5B-Preview.              87.8
DeepSeek-R1-Distill-Qwen-1.5B      91.6 
DeepSeek-R1-Distill-Qwen-7B        95.2 
S1.1-32B  (FeiFei Li,Qwen)            95.4
DeepSeek-R1                                 97.3

請您先登陸,再發跟帖!