最新的Math500模型測試準確率對比

來源: 2025-02-14 15:27:52 [舊帖] [給我悄悄話] 本文已被閱讀:

Qwen2.5-0.5B-Inst.                       76.4 
Qwen2.5-1.5B-Inst.                        81.8 
DeepScaleR-1.5B-Preview.              87.8
DeepSeek-R1-Distill-Qwen-1.5B      91.6 
DeepSeek-R1-Distill-Qwen-7B        95.2 
S1.1-32B  (FeiFei Li,Qwen)            95.4
DeepSeek-R1                                 97.3