“數據蒸餾”決定了DeepSeek輸出的基礎性產品無法超越原創AI大模型。而且“數據蒸餾”隻能在別人已經原創的成果基礎上進行。
在更多的AI實際應用領域,如生物醫療服務、自動駕駛、AI機器人等還在開發的應用中,“數據蒸餾”在原創模型獲得成功前無法做到,在原創模型獲得成功後又可能遇到不會開源分享的難題(因為利益衝突),因而沒有用武之地。一切原創的AI應用模型,隻能老老實實投入算力、時間和資金。這可能也是目前的DeepSeek無法從根本上改變全球AI格局的深層原因。
“數據蒸餾”決定了DeepSeek輸出的基礎性產品無法超越原創AI大模型。而且“數據蒸餾”隻能在別人已經原創的成果基礎上進行。
在更多的AI實際應用領域,如生物醫療服務、自動駕駛、AI機器人等還在開發的應用中,“數據蒸餾”在原創模型獲得成功前無法做到,在原創模型獲得成功後又可能遇到不會開源分享的難題(因為利益衝突),因而沒有用武之地。一切原創的AI應用模型,隻能老老實實投入算力、時間和資金。這可能也是目前的DeepSeek無法從根本上改變全球AI格局的深層原因。
•
V3是從DeepSeek自己的671b參數的大模型上蒸餾的
-maniac63-
♂
(171 bytes)
()
01/28/2025 postreply
19:05:18
WENXUECITY.COM does not represent or guarantee the truthfCCPA ulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy