據觀察者網引述英國《金融時報》18日報導,中國人工智能(AI)團隊在影片生成領域已超越美國競爭對手。報導指出,影片生成是生成式AI的關鍵戰場之一,正快速應用於廣告、電商和娛樂領域。
報導稱,字節跳動、快手等公司正利用龐大的短影音資料庫訓練係統,使其相較美國企業具有優勢。文章認為,這一轉變標誌著AI競賽的一個分水嶺。盡管OpenAI、Google和Anthropic仍在大型語言模型、程式編寫等AI領域占據主導地位,但在影片工具的品質和實用性方麵,已落後於中國產品。
報導指,訓練影片模型需要大量高品質素材,而中國平台透過短影音應用及其生成的數據,在這一領域占據優勢。部分專家也將美國在影片生成領域落後,歸因於美國較嚴格的內容版權規定。
製作AI生成內容的新創公司Director AI創辦人蔣(Ben
Chiang,音譯)表示,“我們試用過的多數美國模型在影片生成方麵均表現不佳”。該公司主要使用快手開發的可靈,也會依任務和成本,在字節跳動Seedance
2.0及新創公司MiniMax的海螺之間切換。
報導指,可靈、Seedance
2.0和阿裏發布的“歡樂馬”等中國應用,在Arena最佳影片模型排行榜上均名列前茅。該排行榜根據用戶在獨立平台上的投票得出,被認為比部分模型基準測試係統更能反映實際應用表現。
不過,Google的Veo
3模型也具競爭力。專家表示,該工具優勢在於可存取YouTube影片素材,但對開發者設有更多內容保障措施和限製。
報導稱,字節跳動和快手營運全球最大的短影音平台,能取得海量專有影片數據,形成競爭對手難以複製的訓練優勢;相較文字資料,影片內容也較難大規模抓取。
報導指,生成影片所需的運算成本遠高於文字或音訊,使大規模部署成本高昂。對個人創作者而言,中國工具通常比西方工具更便宜、更靈活,並提供訂閱或按需付費製度,方便快速測試。
報導續指,對基於影片生成技術開發應用的企業而言,中國工具近期品質快速提升,正在開啟新的商業機會。為電商網站提供影片基礎設施的Firework執行長楊文森表示,過去AI影片“尷尬又生硬”,難以達到品牌標準,但現在已經進展到難以分辨是真人還是AI生成。
他舉例,一家零售商曾要求為產品頁麵建立10萬支影片,若沒有AI,成本將高得難以負擔;如今每項產品都可以擁有自己的影片,甚至可針對不同客群製作多個版本。
