“數據蒸餾”決定了DeepSeek輸出的基礎性產品無法超越原創AI大模型。而且“數據蒸餾”隻能在別人已經原創的成果基礎上進行。
在更多的AI實際應用領域,如生物醫療服務、自動駕駛、AI機器人等還在開發的應用中,“數據蒸餾”在原創模型獲得成功前無法做到,在原創模型獲得成功後又可能遇到不會開源分享的難題(因為利益衝突),因而沒有用武之地。一切原創的AI應用模型,隻能老老實實投入算力、時間和資金。這可能也是目前的DeepSeek無法從根本上改變全球AI格局的深層原因。
“數據蒸餾”決定了DeepSeek輸出的基礎性產品無法超越原創AI大模型。而且“數據蒸餾”隻能在別人已經原創的成果基礎上進行。
在更多的AI實際應用領域,如生物醫療服務、自動駕駛、AI機器人等還在開發的應用中,“數據蒸餾”在原創模型獲得成功前無法做到,在原創模型獲得成功後又可能遇到不會開源分享的難題(因為利益衝突),因而沒有用武之地。一切原創的AI應用模型,隻能老老實實投入算力、時間和資金。這可能也是目前的DeepSeek無法從根本上改變全球AI格局的深層原因。
• V3是從DeepSeek自己的671b參數的大模型上蒸餾的 -maniac63- ♂ (171 bytes) () 01/28/2025 postreply 19:05:18
• 什麽時候山寨產品能在華爾街和矽穀鬧出這麽大動靜。再多來幾打這樣的山寨。 -太陽從西邊出來- ♀ (0 bytes) () 01/28/2025 postreply 20:51:31
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy