今天下午去聽了一個講座,是研究所人工智能在醫學中應用研究領域的一個專家。在講座中,他非常興奮地提到了一個由中國的一個年輕的人工智能研究小組所發布的最新的、也是非常具有開創性的應用軟件產品DeepSeek。我對人工智能不熟悉,我以我的理解寫出下麵的文字,以供有興趣的朋友參考。
一家豪華大酒店,特聘多位全球頂尖廚師,並且購置了一係列高端廚具,要打造一道驚豔世人的美食,經過精心烹製,這道美食終於問世。為了回籠,大酒店有絕對話語權,想賣多少錢就賣多少錢,想接待誰就接待誰,不想接待誰就禁止其入內。
但誰都料不到,一家毫不起眼的小飯店攪亂了原本看似穩固的美食格局。僅用著再普通不過的鍋碗瓢盆,做出了與豪華大酒店不相上下的美味佳肴,成本竟僅為大酒店的百分之一。 最最關鍵的是,小飯店老板居然將美食配方公之於眾。你想吃就自己照著做,如果你不想做飯,要來小飯店吃也行,那我就給你一個超低折扣價。
想想看,豪華大酒店的經理年薪就超過了小飯店一整年的總開銷。此刻,大酒店的經理正焦頭爛額,絞盡腦汁地思考如何解釋呢。 而這家小飯店,正是幻方量化,他們研發出的那道獨特“菜肴”,便是DeepSeek!
DeepSeekR1模型到底有多震撼:
1、推理能力無敵:比肩ChatGPT o1,有序推理和頓悟的強化能力非常嚇人。
2、成本極低:所用的訓練費用,隻是chat GPT的3%~5%,甚至是更低。
3、開源徹底:任何人可隨便下載部署,公開所有訓練步驟與竅門。
4、免費:ChatGPT 一年約1500刀,而DeepSeek無限量免費。
5、全球搜索獨苗:全球唯一的支持聯網搜索的推理模型。
6、純中國方案:Deepseek的最大成功要素是沒用海外人才,沒用美國AI路線。從人才到思路都不用。
7、開始用華為芯片,成本下降70%,從此不怕英偉達壟斷禁售。
我剛剛回到家,就下載了DeepSeek應用程序,與ChatGPT 相比更滑順一些,尤其是中文更順暢些。打開電視,彭博社新聞正在播放經濟新聞,納斯達克指數因受DeepSeek 影響而大幅下跌,其中,英偉達(NVAD)最大時下跌了17%。
完全同意你的評論,還有試用華為麒麟芯片也可以,性能可達95%,以後可能使美國半導體製裁不能完全有效。
DeepSeek的重要意義,在於它把美國刻意營造的AI高大上的桌子給掀翻了。有高端芯片搞AI更好,沒有高端芯片,換個思路和方法,也一樣能搞AI。把AI的成本和門檻一降低,全世界都能試一試,美國就無法壟斷了。OpenAI、穀歌、META這些前期投了大本錢的,想靠壟斷掙大錢快錢的夢,就別做了。這是經濟意義。
另外,DeepSeek模型是開源和免費的,讓大多數歐洲和第三世界國家都用得起。使用者多了,自然就有利於中國AI界在製定國際標準時,有更多的話語權。這是政治意義。
前提是 deepseek 沒有造假。
"deepseek有值得肯定的地方,但他是站在巨人的肩膀上,對整個AI產業來說,真的不算什麽"---
deep seeker 是仿製品,吹牛也有可能。
推理能力無敵,比肩ChatGPT o1,這兩個就是矛盾的。
免費:ChatGPT 一年約1500刀,而DeepSeek不是免費。現在hosted的版本是免費使用,但是有限流。以後一定會收費。關鍵這不是重點。
純中國方案:這個就扯淡了。它的數據就是GPT2(那時開始真的OPENAI)和後來的llama。不是從頭開始的。所謂的AI路線,所有現在的LLM用的都是穀歌的transformer架構。
開始用華為芯片,這個就更扯淡了。
DeepSeek R1的意義是把美國用GPU,不管是數量還是質量,堆砌的AI護城河給推翻了。這一點就很偉大。扯其它的格局反而小了。