流浪槍手

攜書彈劍走黃沙,瀚海天涯處處家。大漠西風飛翠羽,江南八月看瓊花。
個人資料
正文

旁觀DeepSeek,兩個現象細思極恐

(2025-02-02 17:09:16) 下一個

可能國內的朋友還不知道,在歡天喜地加上花天酒地慶祝春節的時候,另一半世界,就是所謂的三分之二的受苦人,卻因為國內一個小公司的大新聞而經曆了冰火九重天。

事情的本身怎麽看似乎都是正能量的好事,簡單來說 ,就是一家名不見經傳的小公司,杭州的深度求索人工智能公司上線並同步開源DeepSeek-V3模型,同時公布長達53頁的技術報告,介紹關鍵技術和訓練細節。最關鍵的是V3模型能力大幅升級,但訓練僅僅花費557.6萬美元,僅用2048塊H800顯卡,耗時不到兩個月。做為參照,美國人工智能初創公司Anthropic曾透露,GPT-40的模型訓練成本約為1億美元。美國開放人工智能研究中心(OpenAI)點評,DeepSeek-V3讓在有限算力預算內進行模型預訓練這件事變得容易。總而言之,就是技術的突破甚至人類的福音。

國內的反響如何不清楚,應該是普天同慶加上民族自豪感大爆棚。這裏說說流浪者在國外的感覺,全都是親身見聞。先說結論,美國這邊的真是反應就是,恐慌,質疑,然後是加強防護網或者防火牆!

最先的恐慌非常直接地在美國股市反映了出來,DeepSeek的出現和其在性能與成本上的優勢引發了市場對美國科技公司估值的重新評估。不出意料的是英偉達的股價在DeepSeek發布後的一天內下跌了16.97%,市值蒸發了5926.58億美元,這創下了美股單日市值損失的曆史記錄。但是整個股市,特別是納斯達克100期貨也因DeepSeek的表現而下跌。歸根結底一句話,隻能是極度的恐懼!

寫到這裏不禁要問自己一句,如果DeepSeek是一家英國公司,或者是歐洲的任何一家公司,抑或是日本韓國,哪怕是台灣的公司,那麽反映出來的,會不會是相反的局麵?!

最初的恐慌過後,媒體上馬上充滿了質疑的聲音,要麽說是數據的Distillation,要麽說是隱藏了成本。這些都還好,充其量就是不信任。

可接下來的操作恐怕就是出乎始作俑者的意料之外了,那就是以美國為首的那類國家,紛紛站出來表態,總而言之一句話,就是加大力度監控向中國出口芯片,進一步限製允許向中國出口芯片的種類和檔次。好像是說,即便DeepSeek的成就是吹牛,也要按照牛皮的大小算作是競爭對手。

如果說最近國內芯片的進展不如新聞中所宣示的那樣樂觀的話,這次DeepSeek的高調亮相,可真是起了反作用,至少於高端芯片的進口需求來說,恐怕是雪上加霜。

也許這都是流浪者的杞人憂天或者無病呻吟,真心也是希望如同一場遊戲一場夢。但心裏實在想不通的是,為什麽,或者說,從什麽時候開始,剛剛說過的這類國家,把中國當成了如此仇視的敵人?!

細思極恐!

話說中美關係,似乎不應該隻是在《長津湖》和《黃河絕戀》之間反複切換,如果以史為鏡的話,還應該想到當年的傳教士,庚子賠款留學生,飛虎隊,上甘嶺,直到關貿總協定。中間的錯中複雜很難讓大家有同樣的觀念。但如果把兩國關係的冷熱,和中國經濟的起伏對照在一起,或者能說明一些問題。

最後加上一句,如果想要學習文科相關知識的話,還真不能建議使用DeepSeek,原因不言自明!本來想做個對比,所以問了DeepSeek和Grok同樣的問題,隻不過後者給出的答案太過細致周密,以至於截圖都成了難題,關鍵是兩者絕不在同樣的檔次。

以下為Grok生成文字。

如何評定海參威的歸屬?

海參威(海參崴)的歸屬問題涉及複雜的曆史、法律和外交因素。以下是評定海參威歸屬的一些關鍵點:
曆史背景:
海參威原為中國清朝的領土。1858年中俄簽訂《璦琿條約》後,海參威被劃為中俄共管地區。1860年,《北京條約》簽訂後,海參威正式成為俄羅斯帝國的領土,改名為符拉迪沃斯托克(Vladivostok)。
國際條約:
1945年,中蘇簽署《中蘇友好同盟條約》,其中蘇聯承諾在50年後將包括海參威在內的部分領土歸還給中國。然而,這一承諾在實際操作中並未實現。
2001年,中俄簽署《中俄睦鄰友好合作條約》,中國正式放棄了對包括海參威在內的領土的主權要求,從而確認其為俄羅斯領土。
現代外交關係:
現今,海參威作為俄羅斯遠東地區的重要城市,其歸屬權已在國際法和雙邊條約中確立為俄羅斯的一部分。中俄兩國在外交上也承認這種狀態。
公眾和網絡輿論:
在中國的一些網絡平台上,關於海參威歸屬的討論常常涉及到對曆史不平等條約的反思和對領土丟失的遺憾。但這些討論並不影響現有法律和國際承認的現狀。
綜上所述,海參威的歸屬在現今國際法律框架和外交關係下明確為俄羅斯聯邦的領土。雖然曆史上有過爭議和條約調整,但目前的法律和事實狀態是其歸屬俄羅斯。

中國承認滿清政府簽訂的不平等條約嗎?

中國政府對清朝簽訂的不平等條約持複雜的態度,主要體現在以下幾個方麵:
曆史認知:
中國官方和學術界普遍認為,清朝晚期簽訂的許多條約(如《南京條約》、《北京條約》、《璦琿條約》等)是不平等的,這些條約在當時導致了中國主權的嚴重喪失和領土的割讓。中國政府和曆史學家通常將這些條約視為帝國主義侵略的產物。
法律承認:
盡管中國承認這些條約在曆史上確實存在,並且它們曾經對中國的主權和領土完整產生了深遠影響,但在法律上,中國政府並不承認這些條約的公正性或合法性。例如,在涉及領土問題的討論中,中國經常提及這些條約是通過不平等手段強加的。
外交政策:
在外交上,中國在處理與這些條約相關的問題時,常常強調曆史公正和主權完整。例如,關於香港和澳門的問題,中國政府在恢複主權時明確表示,這些地區的回歸是糾正曆史錯誤的結果。
對於像海參威(符拉迪沃斯托克)這樣的領土,中國在現代國際關係中已通過簽署新的條約(如2001年的《中俄睦鄰友好合作條約》)正式放棄了對這些地區的主權要求。
教育和公眾輿論:
在教育和宣傳中,中國強調這些不平等條約對民族和國家造成的傷害,以增強民族意識和愛國主義教育。但這並不意味著中國在實踐中否認這些條約對現狀的影響。
總結來說,中國雖然在曆史上和道德上不承認這些不平等條約的正當性,但出於維護當前國際關係和和平的考慮,承認並遵循了這些條約在現實中的法律後果。中國對這些條約的態度是既不完全否認其曆史效力,同時又強調其非正義性。

[ 打印 ]
閱讀 ()評論 (12)
評論
山鄉不仕老了 回複 悄悄話 @Opa:事情不是這麽簡單。
Opa 回複 悄悄話 把中國當成仇敵有兩個時間節點, 起到了決定性的作用:
1.中國修改憲法,把任期製改成任期不定製。
2. 香港國安法

以上兩個因素隻是導火索, 最關鍵的是西方對中國的預期和現實發生的巨大的差異。 西方預期是政治製度發生改變, 共產黨倒台。 而現實是中國共產黨統治不僅穩如泰山, 還讓中國走到的世界的頂端。
xiaoxiao雨 回複 悄悄話 we want to see China wealthy really do not want to chinese style governing prevail in the world.
西岸-影 回複 悄悄話 今天看美國的報道,大概是DeepSeek開源的程序研究透了,得出結論DeepSeek沒有使用英偉達與open AI合作設計的框架CUDA,這是openAI的防止競爭的所謂防火牆,核心技術,因此DeepSeek是可以利用中國目前已經自己生產的芯片的能力實現算力,並不一定需要英偉達的芯片。
也就是說與openAI沒什麽關係,幾天前openAI指控的東西不成立。
但更深層的意思是openAI的技術已經開始過時了,哪怕曾經很具有先進性。
其實不僅是openAI的技術過時,中國其他大模型的技術也過時了,比如阿拉巴巴的。
你花了那麽多錢,今天才發現一開始的路子就走錯了,你怎麽辦?按照西方壟斷經濟的模式,就需要把更先進的技術封存,等到老的技術掙夠了錢的時候才開放。
這就不難理解美國對DeepSeek的反應。
但可以預期會有一部分資本轉移到DeepSeek的發展模式,即使是openAI也不得不改變自己,從技術領先變成追趕。
西岸-影 回複 悄悄話 首先,DeepSeep並不是一款AGI,也就是達不到替代人類大腦的程度,目前的結論是在數理邏輯領域上強於其他任何AI產品,但在語言理解上不如ChatGPT,因此不能指望在文科類領域具有比較強的表現。
AI是工具,不適合用於主觀意識決定的領域,比如政治和文科領域都是主觀起決定作用的領域,沒有客觀標準。
第二,不論這個產品是哪國的,都會對美國產生這種衝擊。比如哪怕是英國的。
因為DeepSeek有兩點是美國無法比的,第一就是免費,第二是開發成本不高,這兩者共同特點就是省錢,不僅對用戶省,也對投資商。
美國發展模式是追求最大收益,具體方法是競爭中獲勝,然後壟斷圈錢,巨額的錢。
具體在AI,目前美國是openAI領先,計劃是建立星際之門Stargate,幾十個算力和數據中心,和一個供電的核電站,全世界不論誰想要使用AI作為工具,就不得不付費從Stargate獲得許可。目前openAI的ChatGPT月費最高達到200美元,試想全世界70億人,假如有1%需要使用美國AI,費用是多少?
更不要說任何公司如果想開發自己的AI應用產品,需要Stargate的服務,那就不是200美元的概念了。
這會讓Stargate的盈利達到美國經濟規模超過一半的程度,這就是為什麽川普這樣看中這個計劃,支持Stargate建立,計劃投入五千億美元,當然主要是私人投資。
如今出來個DeepSeek,告訴你並不需要五千億就能做同樣的事,用5%的錢就夠了,投資商怎麽想?誰還願意投資Stargate?
而且DeepSeek告訴你我不僅不收那200美元的月費,是完全免費,而且開源,也就是假如你歐洲科研機構也想進入AI領域做具體領域的應用,你也不需要花錢,你把我的源程序拿去改改就能適合你的需求,開發出新產品。
因此DeepSeek如今在世界上被稱作民主化了AI,美國再也不能獨裁。
賭人財路等同殺人父母,美國不論AI企業還是政府會怎麽看?
目前AI發展是在模仿人類大腦的初級階段,還不是AGI的程度,而且最終可以用於各個領域的是在此之上的具體工具,比如醫學工程等等,那需要專門的API,也就是接口針對不同的領域。因此在如今AI產品上繼續發展的前景無量,目前還沒有真正開始,隻是在做基礎建設。
目前隻有中美能做AI產品的原因是其他發達國家沒有這種電力支撐,AI的訓練需要大量的芯片和電力能源,隻有中美具備這兩個要素,中國的發電量是美國的兩倍,華為的芯片算力水平比美國落後一年左右,相對費電。
而一旦“大腦”訓練出來了後使用,就沒那麽花費大了,很多國家都可以用,但不得不用這個大腦做基礎,服務器還在中美,也就是意味要花錢。
DeepSeek的公司深度探索隻成立了不到兩年,大概總共花了兩千萬美元,美國AI公司花錢動輒上十億美元,整體已經花了14萬億美元,相當於美國全年GDP的一半。
也就是深度探索還不到需要掙錢的階段,因此不在乎這東西免費和開源,誰都可以拿去用,使用的過程也是繼續訓練這個大腦的過程,因此客觀上並不是白給。
但美國企業已經花了14萬億,需要有回報了,否則誰會給Stargate投錢?沒人投錢就不能壟斷,就不能繼續發展,不能完成的產品叫半成品,一錢不值,這客觀上等於14萬億打水漂。
這就是為什麽美國不論政府還是企業發動一切力量打擊DeepSeek,而不會在乎是誰開發的。隻不過打擊中國屬於政治正確而已。美國政府和主流媒體聯合西方各國這麽多年來抹黑中國,國會甚至去年專門撥款16億美元訓練主流媒體抹黑中國,形成國際新聞,都是因為這個因素。比如加拿大官方網站如今把中國列為旅遊危險國家,說中國普遍發生現款街頭被偷被搶的事件,因此旅遊風險大。
如今中國還有誰身上帶現款?你去誰身上偷或者搶?去年有九千萬人次訪問中國,遊客印象最深,認為最應該引進西方的就是移動支付。
目前DeepSeek是世界上最好的AI工具,手機上就可以用,生活中很方便,完全替代穀歌這類搜索引擎不算,還能給你做計劃提供很多選擇,最低也可以無聊時與其聊天,學到很多知識和長見識。
美國GDP一半的錢等於沒了,但凡美國有點軍事自信,早就發起對中國的戰爭了。
如今可以知道試圖壟斷世界或者對世界獨裁的Stargate是沒意義了,距離世界大同又近了一步,DeepSeek也就具有政治意義。有點像當核武被不止一個國家掌握時,世界才有和平。1949年蘇聯爆炸了第一顆原子彈,蘇聯科學家說蘇聯的安全有保證了,美國的科學家說世界的安全有保證了。
有媒體形容如今美國關於這件事的過程類似悲劇後的五個階段,先是憤怒,再是不承認,這些美國都做過了。
如今是反思階段,以後還有兩個階段。
才會走向現實。
中國的所謂白菜價模式有兩個意義,第一就是打破壟斷,第二是迫使技術不能鎖緊保險箱不能拿出來用,這等於促進技術發展。
soullessbody 回複 悄悄話 回複 '過往的西' 的評論 : 問題是怎麽訓練呢?
soullessbody 回複 悄悄話 回複 '矽穀工匠' 的評論 : 不知道它是怎樣屏蔽和抵抗外界信息的,如果DS讀到外界/外文媒體,或者很多人不斷地通過各類輸入去訓練它,會不會有朝一日它也會認為刁夶是豬頭呢?
矽穀工匠 回複 悄悄話 大語言模型訓練,代表著詞組的接近。如果中國模型把習近平,天使,美好這幾個詞接近,那你一提習近平它就會聯想到美好和天使,而不是小熊。這個訓練的參數是不開源的。開源的隻是模型的方法,真正的meat不告訴你,也太大了。所以才會去小抄蒸餾別人的題庫。
soullessbody 回複 悄悄話 親自指揮親自部署,ego比天高,本事比沙小,不靠《長津湖》和《黃河絕戀》無法安撫分裂的人格啊。
sysyphe 回複 悄悄話 揣著明白裝糊塗吧? 中共國可是一直都把美帝西方國家當敵人看待的呀?有多少人為911歡呼雀躍?有多少人認為covid是美國人的陰謀? 有多少人為美國的病毒死亡人數而叫好?有多少人把美國主導的北約視為邪惡之源?有多少人動不動就罵歐盟是美帝的走狗?
現在美國人算是終於把中宣部的話當回事兒了, 這不挺好的嗎!求錘得錘

"從什麽時候開始,剛剛說過的這類國家,把中國當成了如此仇視的敵人?!"
波士頓的新人 回複 悄悄話 東麵是“小日子”,西麵是“美帝”,北麵是“棒子”,南麵是“阿三”,是國人把整個文明世界當成敵人,然後才會遭此反擊,怪不得別人。中華民族要先學會如何尊重別人,然後才有機會贏得別人的尊重。
過往的西 回複 悄悄話 deepseek是開源的,你可以把它訓練成客觀公正的AI,這才是厲害的地方
登錄後才可評論.