2023年7月,Meta發布了類似於ChatGPT的開源人工智能模型Llama 2,供任何人下載和使用,從而顛覆了構建更強大人工智能的競賽。11月,就有01.AI這家來自北京的初創公司,發布了自己的開源模型。據稱該模型的性能優於Llama 2,在許多用來比較人工智能模型力量的排行榜上得分接近榜首。2024年1月22日,之前鮮為人知的人工智能初創公司01.AI又推出了一款名為Yi-VL-34B的“多模式”人工智能模型,可以處理圖像並討論其內容(下圖 pandaily/Hugging Face)。
01.AI係統中的部分技術來自Llama 2。01.AI的創始人兼首席執行官是李開複,他同時也是大陸創新工場(Sinovation Ventures)董事長和CEO(下圖 STATION F)。李開複的新公司以Meta的技術為基礎,用新數據訓練係統,使其變得更加強大。這種狀況反映了在中國大陸公開承認的現實 -- 幾乎完全依賴於美國的底層係統。李開複在電子郵件聲明中說,他的初創公司的人工智能模型是建立在LLaMA上的,就像“其他大多數人工智能公司一樣”,並補充說,使用開源技術是一種標準做法。他說,他的公司使用自己的數據和算法,從零開始訓練人工智能模型。這些都是01.AI“表現出色”的“主要決定因素”。
01.AI創立於2023年6月,已從大陸電商巨頭阿裏巴巴和其他公司籌集了2億美元的投資,估值超過10億美元。“這是我整個職業生涯的願景,”李開複在北京一間公寓裏通過Zoom對采訪記者說道。“我們學習計算機語言已經太久了——我們真的需要能夠理解我們語言的係統,即語音和文本。”在中文中,01.AI被稱為“零一萬物”, 與漢語中的“靈異萬物”諧音,後者源於中國道教《道德經》。李開複表示,他的公司旨在通過構建一些基於語言模型功能的首批“殺手級應用程序”來引領這場革命的下一階段,這些應用程序可以賺取“零一萬物”(01.AI)的健康收入。
李開複希望“零一萬物”(01.AI)能激發一批忠實的開發者,幫助其孵化出一些殺手級的人工智能應用程序。由於地緣政治因素,以及資金限製,包括“零一萬物”在內的大陸AI公司無法用到算力最強的英偉達GPU芯片。但“零一萬物”正探索如何用最少的芯片、最低的成本訓練出最好的模型(下圖 零一萬物)。李認為與“零一萬物”相關度更高的是“AI普惠點”,他希望團隊成為一個“點燃者”,幫助開發者通過API和Yi係列模型,在電商、社交、娛樂等領域打造出AI時代的淘寶、微信、抖音等。本人就是人工智能專家的李開複以華為為例,說明了這種專注的實踐效果。作為中國領先的電信設備製造商,華為利用土耳其IT研究員埃達爾·阿裏坎一項不起眼的技術進展,幾乎集全公司之力,把他的極化碼技術突破商業化。這讓華為最終超越了愛立信(Ericsson)等西方較大的競爭對手,並搶占了大部分的5G移動網絡市場。
李指出,我們不追求用一百億美金、一千億美金去預測AGI的燃點,而要非常努力地節省GPU成本,專注於高效執行。“贏得移動時代勝利的應用程序是那些首先移動的應用程序,比如優步、微信、Instagram、TikTok。“零一萬物”(01.AI)的工程師們正在試驗不同的“人工智能優先”應用程序,以提高辦公效率、創造力和社交媒體。李表示,該計劃旨在讓他們在全球範圍內取得成功,就像中國支持的社交網絡TikTok和在線零售商Temu是美國消費者心目中的頂級應用一樣。
2024年5月13日,在“零一萬物”(01.AI)成立一周年之際,公司 CEO 李開複博士發布全球SOTA千億參數閉源大模型Yi-Large(下圖 澎湃),並同步開放API,允許開發者調用,在此基礎上還發布了一站式AI工作平台萬知。李開複透露,經測試,Yi-Large評測結果已經至少達到對齊GPT-4,部分指標甚至超越GPT-4。此外,“零一萬物”正在訓練的基於MoE架構的更大模型Yi-XLarge MoE,目前初步訓練結果顯示,Yi-XLarge MoE的各個指標都已經超過Yi-Large,將衝擊GPT-5的性能與創新性。在通用能力、代碼生成、數學推理、指令遵循等多方麵,模型指標超越了ChatGPT-4、Google Gemini 1.5等同級模型。
至此“零一萬物”(01.AI)與OpenAI等美國公司之間的差距,從去年創立時的八年縮短到現在不到十二個月。
李開複背景
李開複在人工智能領域有著傑出的職業生涯。李開複祖籍四川成都但出生在台灣新北市。自美國田納西州橡樹嶺高中畢業後,他先後在哥倫比亞大學和卡耐基梅隆大學學習計算機科學,並獲得了博士學位。李開複在卡耐基梅隆大學的博士論文涉及當時處於領先地位的語音識別係統開發,被《商業周刊》授予當年“最重要科學創新獎”。
李開複於1990年加入蘋果公司,擔任研究科學家,多媒體實驗室主任,互動多媒體部全球副總裁。1996年李開複轉到SiliconGraphics,擔任互聯網部門副總裁兼總經理、Cosmo軟件公司總裁。1998年李開複到中國大陸,幫助建立了微軟亞洲研究院。李曾任微軟公司自然交互式軟件及服務部門副總裁,和微軟全球副總裁。2005年,李開複轉為穀歌工作,擔任穀歌全球副總裁兼中國搜索業務總裁,2009年離職,在大陸北京創辦了自己的投資公司“創新工場”(Sinovation Ventures)。李開複在2018年出版的《人工智能超級大國》一書中就預言,由於中國大陸擁有豐富的人才、數據和用戶,大陸的人工智能實驗室和公司很快就會與美國的實驗室和公司競爭(下圖 Medium/YouTube)。當然,他更主張美中合作。
美中人工智能現狀
盡管“零一萬物”(01.AI)於2024年5月13日發布的SOTA千億參數閉源大模型Yi-Large對齊GPT-4,部分指標超越GPT-4,且在LMSYS Org發布的Chatbot Arena取得排名第7的成績,甚至排在穀歌的Bard(Gemini Pro)和Meta的Llama-3-70b之前(下圖 LMSYS Chatbot Arena),但它目前在生成人工智能方麵還是在追隨美國的步伐。喬治華盛頓大學研究中國人工智能場景的助理教授丁傑夫(Jeffrey Ding)表示,盡管中國研究人員已經發布了數十個大型語言模型,但整個行業仍落後於美國。他說:“西方公司在大型語言模型開發方麵獲得了顯著優勢,因為他們可以利用公開發布來測試問題,獲得用戶反饋,並圍繞新模型建立興趣。”而且隻有西方,其實就是美國公司,才能拿到算力最強的GPU芯片。據說華為合作中芯已攻克3納米芯片技術。但隻有真正量產出可與媲美英偉達GB200的GPU芯片後,包括“零一萬物”(01.AI)在內的大陸AI模型才有機會比肩乃至超越美國公司的AI模型。此外,與美國同行相比,中國人工智能公司還麵臨著更大的監管和經濟阻力。
目前01.AI的零一萬物一站式AI工作站萬知有微信小程序(wanzhi.com/)和PC網頁版。用戶通過使用萬知既可以閱讀海量數據、分析圖表和文字,又可以在1-2分鍾內生成PPT。01.AI開源地址:Hugginf Face https://huggingface.co/01-ai(下圖 01.AI)。
參考資料
Hetzner, C. (2024). Leading China VC Kai-Fu Lee warns an investor reckoning is coming for unprofitable AI companies. FORTUNE. 鏈接 https://fortune.com/asia/2024/03/27/china-ai-kai-fu-lee-warns-investor-reckoning-unprofitable-ai-companies/
Knight, W. (2024). This Chinese startup is winning the open source AI race. WIRED. 鏈接 https://www.wired.com/story/chinese-startup-01-ai-is-winning-the-open-source-ai-race/
孟建國, Liu, J. & Metz, C. (2024). 中國“AI大混戰”背後:想超越美國,又離不開美國. 紐約時報中文版. 鏈接 https://cn.nytimes.com/technology/20240222/china-united-states-artificial-intelligence/