
6月19日消息,在Meta與Scale AI(以下簡稱“Scale”)達成143億美元的投資交易後,數據標注這一曾被忽視的領域正迅速成為矽穀新的焦點。對埃德溫.陳(Edwin Chen)創立的Surge AI(以下簡稱“Surge”)而言,這無疑是一個曆史性的發展機遇。
事實上,數據標注在矽穀長期處於行業邊緣地帶——作為人工智能技術鏈條中的核心環節,其重要性與關注度長期不匹配。穀歌、OpenAI等科技巨頭通常需要依賴外部服務機構,通過對AI模型輸出內容進行細致的質量分級與校驗,才能實現模型性能的持續優化。這種看似繁瑣的人工標注工作,實則是支撐AI係統迭代升級的關鍵基礎。
Meta收購Scale股權的重磅交易,突然間把數據標注業務推向行業聚光燈下。然而,就實際市場份額和業務競爭力而言,埃德溫.陳(Edwin Chen)創立的Surge才是當前數據標注領域的真正龍頭。
01.無融資實現營收反超的“隱形冠軍”
Surge憑借“把客戶AI訓練至行業最高標準”的核心承諾,成功贏得穀歌、OpenAI、Anthropic等科技巨頭的青睞。埃德溫.陳為公司設立了極具野心的技術願景:打造具備真正“創造力與意外發現能力”的AI係統。他描繪了這樣的理想場景——當模型收到“創作一首關於月亮的八行詩”的指令時,能輸出足以“令人潸然淚下”的文學作品。
37歲的埃德溫.陳沒有任何投資者,完全依靠自力更生創辦了這家成立已有五年的初創公司。Surge現有110名員工,在紐約和舊金山設有辦公室。該公司曾向員工透露,其營收去年已超過10億美元,超過了Scale同期8.7億美元的營收。埃德溫.陳還表示,與Scale不同,Surge從創立之初就實現了盈利。此外,如果其他公司效仿OpenAI——因擔憂Scale與Meta的關係而停止與Scale合作——將業務轉向Surge,Surge的營收可能會進一步增長。
不過,Surge的其他關鍵財務數據仍不得而知,例如,Surge在向數量龐大的合同工支付勞動力成本後保留的營收(大多數類似公司,如Scale,會將約一半營收支付給合同工)。如果Surge能獲得與Scale類似的估值(Meta在投資中對其估值為290億美元),這一價格將使埃德溫.陳至少在賬麵上成為億萬富翁,並悄然躋身科技界最富有人士之列。
隨著AI模型從“玩具”轉變為真正的商業工具,數據標注變得愈發重要。Surge等公司雇傭的合同工會對AI模型的響應進行分級,並在編程、數學和法律等領域編寫數千個問題和答案,輸入給AI模型——本質上是教會它們什麽是“優質回答”。Surge子公司Data Annotation Tech官網的信息顯示,其員工”可自行安排時間訓練AI獲得報酬”,起薪為每小時20美元。
埃德溫.陳把Surge定位為“高端服務商”,收費通常是Scale的2至5倍,並以“行業領先的工作質量”證明其定價的合理性。一位前Scale員工表示,事實上,在客戶對標注質量的審計中,Surge的表現往往優於 Scale。Surge的競爭對手、得到凱鵬華盈投資的初創公司Handshake的負責人加勒特.洛德(Garrett Lord)也坦言,Surge才是當之無愧的行業龍頭。
Meta以巨額交易收購Scale的新聞報道並未提及Surge。Scale前首席執行官汪滔(Alexandr Wang)曾被公認為數據標注領域的領軍人物。作為如今Meta AI業務的高管,他在矽穀頗具知名度:不僅頻繁亮相播客與行業會議,還在X平台保持高頻發帖。他之前籌集到15億美元風險投資,讓Scale躋身極少數融資達此規模的公司之列,並雇傭了超過1000名員工。
Surge及其競爭對手有時也會因負麵新聞登上頭條。例如,今年5月,Surge在加利福尼亞州遭遇一宗集體訴訟,原告稱該公司之所以能發展得如此龐大且盈利,部分原因在於違法。這起由Surge部分合同工提起的訴訟稱,公司將員工錯誤分類為合同工,未支付他們必須完成的部分工作報酬,如培訓課程和為確保工作質量而參加的資格考試。Scale和其他數據標注公司也麵臨類似的集體訴訟。
代表訴訟原告的克拉克森律師事務所(Clarkson Law Firm)合夥人格倫.達納斯(Glenn Danas),把此類AI初創公司的工作條件描述為“反烏托邦式的”。Surge發言人則稱該訴訟“毫無根據”。
02.從矽穀工程師到行業顛覆者
埃德溫.陳在麻省理工學院攻讀語言學與數學。畢業後,他先後任職於Facebook、Dropbox、穀歌和Twitter,擔任機器學習工程師,主導推薦係統、搜索算法開發及訓練數據采集等核心工作。這段頂級科技公司的從業經曆,讓他親眼目睹了大公司在數據標注環節的現實困境。
以在Facebook工作時期為例,他曾負責開發一款Yelp競品,團隊需要訓練一個能準確分類企業類型(如區分餐廳與雜貨店)的模型。當時外包機構告知,完成包含5萬個企業樣本的精準標注數據集需要長達6個月時間。更棘手的是,最終交付的數據存在嚴重質量問題(如將餐廳誤標為醫院),這一經曆直接促使他萌生了創立Surge的想法——立誌解決傳統數據標注行業效率與質量雙低的痛點。
“我們除了等待別無他法,” 埃德溫.陳說。當數據交回來時,他驚呆了:在某些情況下,餐廳被標注為咖啡店,咖啡店被標注為醫院。“這些數據完全是垃圾,”他說。
2020年,他離開Twitter創立Surge,並通過矽穀創業者特有的方式——在舊金山Dogpatch社區和教會區的攀岩館偶遇Airbnb和Neeva(一家曾被看好的AI搜索引擎初創公司)的高管,向他們推銷自己的公司——獲得了首批客戶。
為推動Surge起步,埃德溫.陳招募了此前工作中認識的數據標注合同工,並用自己的積蓄為公司注資。巧合的是,當語言模型開始變得重要時,埃德溫.陳把業務聚焦於這一領域——而Scale最初則專注於為自動駕駛汽車評估更可視化的數據。
不到一年後,OpenAI就與Surge簽約,聘請後者對其模型進行微調,通過基於雙方共同發表的研究論文,教模型避免產生有害響應(如種族偏見語言)。到2022年,Anthropic也成為Surge的客戶,該公司部分依賴Surge的合同工來評估大語言模型是否能幫助人類監控其他AI,試圖在全行業開發類人AI的探索中建立安全檢查機製。
數據標注還能確保模型響應的風格一致性。知情人士透露,某企業科技公司曾使用Surge的合同工編寫代碼行及其附帶解釋。這些代碼和解釋不僅必須正確,還需要在不同標注者的示例中保持相似的結構、長度和複雜程度,以確保該公司訓練的模型能輸出符合其風格的代碼。
03.行業共性與Surge的神秘護城河
Surge的客戶表示,Surge對其內部流程及快速生成高質量數據的技術細節守口如瓶,但這種情況在業內並不罕見。“這和我與雲服務提供商合作時的情況一樣,” 上述企業科技客戶說,“我不知道他們的服務為何能如此出色的內部原理,我隻需按下按鈕,就會為其背後的工作成效感到高興。”
數據標注公司通常會使用各種技術,確保合同工在回答問題時不敷衍了事。例如,這些公司會隨機插入無標準答案的"陷阱題",或要求多名標注者對同一問題的正確答案達成共識。
挑選合同工同樣重要,尤其是當模型開發者在計算生物學和理論物理等高級領域編寫問答示例時,越來越需要受過良好教育的合同工,埃德溫.陳不願詳細說明公司如何管理標注者響應的質量,但他表示,除了初始篩選流程,Surge會持續評估合同工。他說,公司可以通過多種信號(例如承包商使用的詞匯或光標移動軌跡)判斷響應是否高質量。
即使在投資Scale之前,Meta也在Surge上投入了大量資金。據知情人士透露,去年,Meta的生成式AI團隊向Surge支付了超過1.5億美元用於數據標注工作,Surge負責從始至終管理整個流程。該人士稱,這與流向Scale的約2億美元相差不遠。
一些客戶反映Surge長期處於滿負荷運營狀態,承接項目需預先支付數千萬美元的承諾金。與此同時,OpenAI等模型開發者正通過Mercor等招聘機構自建標注團隊,試圖繞過第三方服務商。此外,數據標注行業的參與者數量持續增加,這一趨勢已對市場價格形成下行壓力——例如穀歌作為Surge的長期客戶,為避免供應鏈依賴正拓展多供應商合作體係,並成功與Surge協商降低服務報價。
麵對關於業務增長持續性的質疑,埃德溫.陳顯得頗為從容。他指出公眾對數據標注行業存在認知偏差,普遍低估了維持高質量標準的技術門檻。他說:“人們總是想當然地認為,隻要聚集10萬名高學曆人才——比如博士群體——讓他們自由發揮就能產出優質數據。但實際情況是,未經係統化管理的人力投入,隻會導致標注質量的嚴重參差不齊。” 在他看來,Surge構建的標準化質控體係,正是應對行業同質化競爭的核心壁壘。