今年六月,奧特曼在與其弟弟Jack Altman(Lattice創始人)的訪談中提到了OpenAI的未來發展方向。
他描繪了一個宏大的願景:構建一個無處不在的“AI伴侶”生態係統。他說,“消費者最終想從我們這裏得到的是一個AI伴侶。它了解你和你的目標以及你想要完成的事情和你的信息。”
這一願景也正在全球科技巨頭間形成共識。但目前來看,穀歌跑得更快一點:2025年I/O大會上展示的Project Astra,正是一個能夠與現實世界多模態交互、理解複雜上下文的通用AI助手的雛形。
然而,不夠成熟的模型技術、智能設備在形態和續航上的固有瓶頸,都讓它的發展止步不前,但勇於探索的創業者們已經開始另辟蹊徑,邁出了第一步。
有趣的是,在2024年末和2025年初這個時間點下,有此野心的創業者中有很多都不約而同地選擇了用”吊墜“這個硬件形式,試圖搶先登陸個人AI的灘頭。
圖:吊墜形態的AI硬件產品
除去Limitless Pendant的野心稍窄之外,Friend AI、Sein以及剛剛在北美發布的Looki,都把他們的產品底層邏輯,定位到了“帶有記憶能力的個人AI”上。
Looki CEO孫洋是前美團智能硬件負責人、Momenta高級研發總監、Google Assistant創始成員。
孫洋離開穀歌,把在穀歌未完成的心願放到了自己的創業項目:“我們的願景其實和Google的很像——我們想做human-centered AI,把AI真正帶到生活中來,而不僅僅是工作場景。"
那為什麽會吊墜這個硬件形態?想要實現個人的AI伴侶,所需的必要條件是什麽?創業公司在巨頭爪牙下,還有什麽突圍機會?騰訊科技近期與孫洋針對新產品進行了交流,試圖厘清這股AI硬件小熱潮的底層邏輯。
01 Looki:一個全天候的生活記錄員
從外觀上看,Looki很容易讓人聯想到Humane AI Pin。它同樣采用磁吸式設計,可以方便地佩戴在衣物上。但兩者的產品哲學卻截然不同。
孫洋離開穀歌,把在穀歌未完成的心願放到了自己的創業項目:“我們的願景其實和Google的很像——我們想做human-centered AI,把AI真正帶到生活中來,而不僅僅是工作場景。"
Humane AI Pin還是在Chatbot應用的路徑上,而Looki則就是一個多模態信息采集器。
Looki的核心功能是“間隔拍攝”的“故事模式”。用戶通過長按設備上的按鍵啟動後,這個小掛件便進入了真正的“全天候記錄”狀態,以預設的間隔(如每分鍾拍7秒,或每10分鍾拍30秒)自動捕捉第一視角的短視頻。
“一旦啟動故事模式,用戶就可以佩戴在身上,完全無感地生活。”孫洋表示。無論是帶孩子去遊樂場,還是進行戶外運動,設備都會默默記錄下這些珍貴的瞬間。
為了支撐這種不間斷的記錄,Looki采用了經過優化的成熟硬件方案:搭載索尼IMX681攝像頭,支持1080P 30幀錄製,內置32GB存儲空間,配備的電池在間隔拍攝模式下續航可達12小時。
這些參數表明,Looki並未追求極致的影像畫質,其硬件甚至可以在深圳的電子市場快速配齊。
那為什麽要做成掛件的樣式?
孫洋的回答非常直接,也很真實:“我們並不特別在意硬件的具體形態(Form Factor)。今天的掛件,未來可能是成熟的智能眼鏡或耳機。”
而當前的設計,是在現有技術約束下,滿足“全天候可佩戴記錄裝置”這一核心需求的最佳妥協方案。
這個看似簡單的裝置,解決了通往個人AI道路上一個最根本的問題:為AI提供持續、靜默、且富含上下文的多模態信息。
02 硬件不過是醋,個人AI才是餃子
一個真正的AI助手,最重要的能力之一就是“靜默”。它不應該在每一次需要幫助時都由用戶主動喚醒,而應能基於對用戶狀態和環境的理解,主動提供服務。而這一切的前提,就是擁有完整的上下文。
過去的AI係統,獲取個人上下文的途徑極其有限。它們能接觸到的,大多是與個人生活細節無關的文字信息,如圖書、網頁等。這些信息依然是高度結構化且零散的,無法覆蓋我們日常生活中那些瑣碎、真實、卻至關重要的細節。
而且更關鍵的是,這種信息獲取是被動的,需要用戶主動喚起,但用戶不可能永遠有空去在重要時刻喚起它。這樣的信息量,不足以訓練出一個真正懂你的個人AI。
Looki選擇的這個硬件形式,提供了全天候靜默采集係統的基礎。它會定時捕捉你看到的畫麵和聲音,為AI提供了理解用戶的完整的細節“劇本”。
在當前的版本中,Looki會利用雲端AI對這些數據進行處理。在手機App中,AI會自動將一天記錄的碎片按語義分割成不同的“moments”(時刻),並打上“邊開車邊吃早餐”、“專注工作”、“吃麵條午餐”等標簽。
基於這種理解,係統還會在”for you“這個板塊自動生成vlog短片,提取一天中的高光時刻,進行智能剪輯、配上AI生成的背景音樂,並"所有的剪輯、音樂都是AI生成的,"孫洋介紹,"用戶完全不需要後期製作。"
但這隻是第一步。其更深層的能力,是構建了一個基於個人生活數據的AI記憶係統。用戶可以像與ChatGPT對話一樣,詢問關於自己生活的任何問題,比如“我昨天攝入了多少卡路裏?”或“我上周去了哪些地方?”
在騰訊科技的實測中,戴著Looki三天後,Looki能夠幫用戶總結和歸納自己看到的和感受到的一切,還可以精準的幫助用戶回憶起生活的細節。
當回看時,仿佛有第三隻眼睛陪伴著用戶,一起觀察和感知著這個世界。
個人AI的信息采集思路其實很簡單,就是由硬件采集數據,然後AI進行理解分析、並抽象儲存。但其實工程的實踐中麵臨了很多困難。
過去也有很多複雜記憶架構的應用,但問題也很多:理解不夠準確,處理不夠高效,或者處理成本過高。
而Looki的主要護城河,就是構建了一套足夠穩定的記憶係統。這套架構基於GPT-4V等多模態大模型,Looki形成了一套複雜的記憶係統架構,其複雜性遠超簡單的RAG(檢索增強生成),類似於MemeoryOS的水平。
第一道難關,準確性。
相比那些允許用戶上傳任意格式數據(聊天記錄、視頻等)的記憶類產品,Looki的數據都來自同一設備、同一模態。而且任務域也基本限於日常生活。在提供給我們展示中,幾乎沒有具體的工作場景細節。這樣,處理域簡單、處理方式統一,Looki的記憶體係效果就會更穩定、準確性也更高。
而為了解決多模態分析的高昂成本,Looki采用了抽幀語義理解的預處理架構,將計算密集型的視頻理解前置到數據上傳階段,從而大幅降低了後續查詢的延遲和成本。
這種“記錄-理解-查詢”的模式,是通向個人AI的第一步。
更重要的下一步,是讓AI具備主動判斷和預測的能力。
這一點,Looki計劃在下一代產品中逐步加入和完善,例如基於位置和場景的智能提醒。
而這,也恰恰是穀歌Project Astra仍在演示階段,尚未能大規模產品化的核心原因,當下的AI技術,在“主動性”和“可靠性”上,顯然還未完全成熟。
03 除了記錄,更重要的是幫助用戶節省剪輯的時間
既然個人AI的終極形態尚需時日,且當前實現的“記憶係統”其穩定性也需要持續的工程優化,那麽直接將“個人化AI”作為核心賣點,無疑風險巨大。AI Pin等前輩的失敗,很大程度上就是因為畫的“餅”太大,而實際體驗卻無法跟上,導致用戶期望落空。
Looki吸取了這些教訓,選擇了一條更謹慎、更務實的市場策略。它沒有和Sein 與Friend AI一樣高舉高打地宣傳自己是“你的AI大腦”或“生活操作係統”,而是將自己定位為一個更容易被大眾理解的角色,對標影石(Insta360)的“智能運動相機”。
“自動剪輯”、“智能生成Vlog”,這些功能描述具體而清晰。它精準地切入了那些對生活記錄有明確需求,但又被傳統拍攝和複雜後期流程所困擾的用戶群體:希望記錄孩子成長的父母、需要大量素材的短視頻創作者、熱愛分享的旅遊和戶外運動愛好者。
孫洋解釋道,傳統方式拍完素材回家後,用剪映等工具編輯至少需要半小時到一小時,而Looki讓用戶隻管拍攝,AI自動處理,用戶隻需查看結果即可。
這種定位,既讓Looki成功地與Insta360、大疆等傳統運動相機形成了差異化競爭。又這讓產品有了一個清晰的價值主張,避免了像Friend AI那樣,因過於強調模糊的“AI陪伴”概念而導致用戶定位不清的窘境。
04 記憶,正在成為AI應用的新風口
Looki的選擇,不僅是創業公司的生存策略,更在底層順應了AI應用發展的一大趨勢。
為了實現個人AI,知名風險投資機構BVP在其年度AI報告中明確指出,Memory(記憶)和Context(上下文)將成為新的護城河。
他們認為,應該將記憶看作是一種產品,而不是一種單純的後端技術。那些能將記憶作為產品核心來構建的公司,將能定義下一代更智能、更個性化的AI係統。
在這一浪潮下,無論是Looki,還是其他類似的探索者,都是最先下水感受水溫的人。當穀歌和OpenAI還在準備他們的“航空母艦”時,這些“小艇”能否憑借先發優勢,像Manus等產品一樣,通過快速迭代的產品和獨特的體驗,提前搶占用戶心智?
這並非完全不可能。在Cahtbot時代,用戶的需求太過多樣縹緲,很難形成需求飛輪。但對於一個記錄生活的產品來講,用戶的需求點可能更明確,這時候數據的價值可能更大。
不過作為一個經常丟三落四的人,如果Looki真的能夠像PPT裏宣傳的,可以幫我找到我落在角落裏的鑰匙。那它對我來講就確實是能俘獲我心智的剛需產品了。