說的是這個 s1模型的訓練並非從零開始,而是基於阿裏雲通義千問(Qwen)模型進行監督微調。二級蒸餾
所有跟帖:
                    •                    
                    報道裏我沒看到提到阿裏的Qwen,隻提到穀歌的Gemini 2.0。
                     -大觀園的賈探春- 
                    ♀                    
                         
                    
                                                            
                         (0 bytes)
                        ()
                        02/06/2025 postreply
                                                09:58:12
                    
                                        
                    
                    
                                        
                        (0 bytes)
                        ()
                        02/06/2025 postreply
                                                09:58:12
                    
                    
                    •                    
                    那你現在看到了 再評論一下?
                     -Zhivago- 
                    ♂                    
                         (0 bytes)
                        ()
                        02/06/2025 postreply
                                                09:58:57
                    
                                                            
                    
                    
                                        
                        (0 bytes)
                        ()
                        02/06/2025 postreply
                                                09:58:57
                    
                    
                    •                    
                    在你主帖鏈接的那篇報道裏還是沒看到。
                     -大觀園的賈探春- 
                    ♀                    
                         
                    
                                                            
                         (0 bytes)
                        ()
                        02/06/2025 postreply
                                                10:01:55
                    
                                        
                    
                    
                                        
                        (0 bytes)
                        ()
                        02/06/2025 postreply
                                                10:01:55
                    
                    
                    •                    
                    是蒸餾阿裏Qwen, 這是李飛飛的論文。
                     -Knight_2024- 
                    ♂                    
                         (81 bytes)
                        ()
                        02/06/2025 postreply
                                                11:33:34
                    
                                                            
                    
                    
                                        
                        (81 bytes)
                        ()
                        02/06/2025 postreply
                                                11:33:34
                    
                    
                    •                    
                    哈哈,被打臉的不出聲了
                     -manyworlds- 
                    ♂                    
                         (0 bytes)
                        ()
                        02/08/2025 postreply
                                                23:11:03
                    
                                                            
                    
                    
                                        
                        (0 bytes)
                        ()
                        02/08/2025 postreply
                                                23:11:03
                    
                    
                    •                    
                    基礎模型是千問。準備的1000條推理訓練數據是從Gemini Flash爬下來的。
                     -林誠毅德-Lincoln- 
                    ♂                    
                         (0 bytes)
                        ()
                        02/08/2025 postreply
                                                09:51:44
                    
                                                            
                    
                    
                                        
                        (0 bytes)
                        ()
                        02/08/2025 postreply
                                                09:51:44
                    
                    
