AI產業—規模之戰
盡管有人開玩笑說現在在矽穀聊AI,中文是通行語,非中文母語的人抱怨說,不來點兒中文就有點出圈的感覺,嗬嗬,感覺有點好,側麵反應現在矽穀AI圈,尤其是技術咖裏,中國人之普遍確實是一個現象,畢竟AI教主和可能的教母,都是華裔,不過他們可都是說英文的。
真要認真的話,事實數據其實對中文文化背景的人並不樂觀,大語言模型訓練數據的語言占比直接影響模型的全球適用性和文化偏置。2025年,互聯網內容以英文為絕對主導,這放大了訓練偏差,美國模型以英文為主,占比超92%,在編碼與推理任務上保持領先,但非英文語料占比低。中國模型通過提升中文語料占比至30%-50%,在本土任務上表現更優,中文準確率達85%。美國語料庫雖涵蓋多語種,但清洗後英文占比更高;中國則通過兩個歐洲開發的語料庫做模型訓練,同時合成翻譯數據提升中文覆蓋,預計2030年中文語料自給率將超70%。
今年,美國投資領域裏,最打眼的就是數據中心的投資,投入金額驚人,規模龐大,動輒千億、幾千億美元投入,但受限於電網瓶頸與能效挑戰。液冷技術雖已應用於高密度機櫃,但普及率受成本製約仍然不高。相對美國在這個領域近乎白熱化的積極,中國表現的按部就班,美國最吃緊的電力容量問題,在中國不是個事兒,液冷技術方案與創新也積極,但總體產業上的投資遠遠不如美國,與美國的算力緊張,一票難求的態勢相比,中國甚至有閑置率的問題。
在AI產業引擎方麵,OpenAI以模型性能與生態整合領先全球,最新估值已接近5000億美元,中國拿的出手的是DeepSeek、Zhipu、阿裏等,大概加起來估值不會超過50億美元,但中國強調自己是開源模型,訓練成本低。
最後,AI芯片方麵,美國以NVIDIA與AMD主導高端市場,芯片性能與開發生態領先,出口管製進一步鞏固優勢。中國自給率幾乎可以忽略,華為高調唱到現在,東西還是拿不出來,就算拿出來,也隻是主流芯片的一個配角。
在上述的四個維度上,很明顯雙方差距是巨大的,首先訓練的數據語言,資料和信源的文化背景差異太大,幾乎是一邊倒的碾壓性優勢,這一點沒辦法,不是現在的中國不努力,而是整個現代化就是母語為英語的國家開創的,近300年的積累,這方麵你是無法用四十年走完人家300年的路的,也不能生造,而是必須老老實實的跟隨,把基礎做好,才有可能做大,如果排斥這一點,那你怎麽玩也是不能出圈的,這是肯定的。
在AI基礎設施的投入上,完全尊崇市場經濟原則和自以為是的計劃經濟會走出徹底不同的路線,最後的效率和技術路線表現將大相徑庭,因為這是一個典型的邊創新、邊建設、邊淘汰、邊在多方合作中逐步確定技術標準的係統性工程,也就是說,根本無從計劃,根本計劃不得,一旦計劃,必將會被反噬,而且浪費嚴重,破壞力極大!那能不能等你們都試錯結束,找出最佳方案之後再參與呢?可以的,隻是這樣的話,就不要談競爭與可能領先,不過,和前幾次工業革命不同,這次如果不能占據領先身位的話,不會有什麽後發優勢了,這次是智能革命,替代的是部分的大腦功能,複製的話,很有可能你就變成他了,什麽意思?就是一個又紅又專的共產主義戰士想抄近路,玩後發優勢快速複製,結果完成後你變成資本主義大壞蛋了,而且又黑又專,無法回頭。
產業引擎方麵,整個七大群體都是主角,加上OPEN AI,還有許許多多的新晉獨角獸,以及各種層麵的企業參與應用,讓美國的AI產業發展,活力無窮,長效性滿滿。其實現在不管是基礎設施建設還是應用層,長臂已經延伸到歐洲和東南亞地區了,這方麵是目前中國完全無法比對美國的所在,除了字節跳動讓人感覺在AI應用上進展明顯,其它幾家實在乏善可陳,精力都放在外賣搶單上了吧。
芯片方麵差距就更大了,其實這個問題上,大眾的認知,甚至川大總統都相對有限,有一定的技術封鎖和限製是必要的,但沒必要搞的過頭,黃仁勳說的是表麵官話,什麽封鎖反而會激發他們的創造力之類的話,更真實的情況是,他對GPU技術發展有十足的把握,尤其是下麵數代的GPU完全不是單個單元芯片唱戲,那是一個巨大的係統工程,多方參與的,而且是一個必須在自由競爭的,充分市場化的體係下才能做出來的東西,因為這個過程需要完全自主的多次磨合與適配,隻有充分市場化的環境才能做,GPU未來會是一個集群,結合特殊適配的數據中心和許多環節共同輔助運作才能發揮巨大能力的係統,這豈是一個達到了頂級納米要求的芯片能做的事。
整個AI產業很大,我說的並不全麵,但把核心的脈絡整理出來了,得出的結論是,所謂的中美AI爭奪戰根本就是個偽命題,完全不在一個維度上,差距太大了,而且是越拉越大,在AI發展的早期,它就是一個規模之戰了,數據積累也好,數據中心和GPU集群也罷,各種應用的廣度和深度,不達到一定規模,這個產業是起不來的,甚至缺少幾個環節都不行,至今中國沒有一家萬億美元的企業,就算騰訊很大,也隻是一個區域性的的企業,甚至談不上國際大企業,而AI要求的基座巨大,不到一定規模,是根本玩不轉的.
互聯網你可以美國弄個穀歌,你自己搞個百度,以此類推,複製很多中國版,AI大概率不允許這樣,非要這樣你就玩不轉。
雖然中國在電動車和機器人產業與技術上的發展比較明顯,對整體AI產業而言,這兩塊拚圖隻是應用的基座,不是主流,主流是自動駕駛和未來裝在機器人腦袋裏的類人大腦,這才是AI的主流,那是需要多環節的規模聚集才能出成果的,我認為中國現在在這方麵的認識不足.
諷刺的一點是我在撰寫此文時向中國AI提問,中國最大市值的企業是哪一家,它給我的答案是台積電,並且自動向我宣傳為什麽這麽說,是根據國家哪條哪項規定得出的結論,行吧,它好強硬啊,那就是台積電吧,我下次不問了,又不是隻有一家可以問!
更多我的博客文章>>>
