近期,騰訊科技和《人類簡史》作者尤瓦爾.赫拉利展開了一場深度對話:
對談尤瓦爾·赫拉利:人類對秩序的渴求先於真相,是互聯網和AI控製個人的首要原因
在對話中,赫拉利著重探討了人工智能對個體決策的潛在影響,表達了對技術被少數人掌控的憂慮。
然而,最新研究顯示,AI的威脅已遠超赫拉利的預判。2024年4月發表在arXiv預印本平台的“SocioVerse”研究論文揭示了一個更為嚴峻的現實:AI技術已突破個體影響的邊界,邁入群體操控的新階段。
這項由複旦大學主導、聯合上海創新研究院、羅切斯特大學、印第安納大學以及中國社交媒體平台小紅書共同完成的研究,通過構建一個基於1000萬真實用戶數據的社會模擬係統,展示了AI不僅能夠理解和影響單個個體,它還可以操控成千上萬的人,甚至預測並潛在地塑造整個社會的集體行為。
這種從微觀個體到宏觀社會的技術躍遷,讓赫拉利的擔憂顯得幾乎過於保守——我們麵臨的風險遠比他當時預見的要嚴重得多。
如果說赫拉利擔憂的是AI成為精通心理學的個人操縱者,那麽“SocioVerse”則表明,AI正在演變為洞悉社會規律的超級架構師——一個能解碼社會結構、預判群體動態,並可能改寫社會運行邏輯的數字巨靈。
這一技術躍遷將AI風險從微觀個體層麵提升至宏觀社會維度,其潛在衝擊的深度與廣度,遠超我們此前的想象,其潛在後果之深遠令人戰栗。
SocioVerse:數字孿生社會背後的神秘麵紗
SocioVerse意圖構建一個前所未有的係統:一個能夠模擬和預測真實人類社會行為的完整數字世界。
回溯至二十世紀中葉,社會學理論奠基人亨普爾和歐本海默就曾預言:真正的因果解釋必須建立在社會現象的可預測性基礎上。此後的多年間,盡管計算社會學不斷發展,但傳統社會模擬技術始終麵臨根本性局限——它們要麽過度簡化社會複雜性,要麽與現實世界嚴重脫節,無法捕捉瞬息萬變的社會動態、多元群體的行為差異,以及微妙的人際互動機製。
SocioVerse的誕生徹底改寫了這一局麵。這個係統不再是對社會的粗糙模仿,而是一個具備高度保真度的數字鏡像。
通過整合最前沿的人工智能技術,它實現了對社會係統的全要素建模,包括:
●動態演化的社會環境
●具有獨特行為模式的個體
●複雜的社會互動網絡
●微妙的信息傳播機製
這一突破使得SocioVerse超越了傳統社會模擬的範疇,成為首個能夠與現實社會保持同步演進的數字孿生體。其建模精度和係統完備性,標誌著計算社會學研究達到了前所未有的高度。
用1000萬個虛擬人,構築一個流變真實的世界
之所以SocioVerse算是能模擬這個社會的項目,是因為它確實建構了一個能“以人類社會的方式運行”的社會模型——一個具備時間性、個體性、情境性、互動性與變遷性的係統。這使它不僅能模擬社會行為,還能模擬社會變遷。
在大多數社會學入門課程中,教師總會畫一張簡單的圖:一些點(個體)和連接這些點的線(關係)。但這張圖從來沒有告訴我們,一個人為什麽轉發了某條微博、為什麽開始焦慮地關注房價,或者,為什麽在看到“AI裁員”的新聞時,忽然改變了對技術的態度。
這是人的行為不是在真空中產生的,它總是在事件的時間線上、身份的社會結構中、語境的交互場中發酵。社會,不是一堆人,而是一種信息的共振結構。
這正是SocioVerse的起點:如果我們要模擬社會,就不能隻模擬人,還要模擬信息,及其如何穿透人群,塑造情緒,匯聚成共識或撕裂。
於是,他們設計了四個協作的引擎:社會環境引擎、用戶引擎、場景引擎、行為引擎。這四者的協作,恰好對應了社會結構中最核心的四個邏輯維度:時間性(事件如何演化)、個體性(誰在被影響)、情境性(在哪種互動中)和互動性(如何相互作用)。
第一步,個體維度:從標簽到人格的進化
SocioVerse的用戶引擎可能是它最具人類學雄心的部分。他們從Twitter(X)與小紅書上采集了超過1000萬個真實用戶數據,超過7100萬條社交發言。然後,用三個最強LLM(GPT-4o、Claude
3.5、Gemini 1.5)給每一個人打標簽。
這些標簽不光包括我們熟知的人口學標簽,比如年齡、性別、種族、地區;在這一層,基本就是傳統推薦引擎的極限了。
而LLM的語義理解使得這一係統還可以對用戶的政治傾向、消費偏好、價值觀打標簽。除此之外,他們甚至能對你的人格本身做標記,在實驗中,他們應用了Big
Five人格模型(開放性、責任心、外向性、宜人性、神經質)對智能體做了分類,甚至連他們做表達的語義風格也可以分類模擬,比如它是偏情緒表達,還是喜歡邏輯分析。這使得這一係統中的模擬人Agent具有了過往係統所完全沒有的細膩度和真實性。
完成這一係列打標後,係統會將標簽交由人工評審,再訓練成分類器,讓整個用戶庫真正變成一個活的社會人群圖譜。這些圖譜包含:
●基礎屬性:年齡、地域、職業等人口學特征
●心理特征:大五人格特質(開放性、盡責性等)
●行為特征:表達風格(如“理性分析型”或“情緒宣泄型”)
●價值取向:政治立場、消費觀念等深層傾向
這使得研究者能精準調用特定人群畫像,如“技術樂觀的95後程序員”或“對AI持懷疑態度的中年主婦”。
第二步,時空維度:動態演進的社會劇場
如果說社會是一個係統,那它首先是一個時間係統。人們的行為不是在“狀態”中生成,而是在“進程”中變化。
為了實現社會的時間性變化,在建立完個人後,SocioVerse還建立了一套“社會環境引擎”。
它通過實時抓取新聞事件、政策變動、經濟指標等數據,構建持續演化的社會背景。以美國大選模擬為例,係統不僅輸入候選人政見,還整合了各州失業率等經濟數據、社交媒體話題熱度、突發公共事件影響,形成了一部24小時更新的“社會紀錄片”。
第三步,場景維度:情境敏感的行為模擬
首先是場景引擎。我們對一個問題的回應,並不是脫離上下文的“意見表達”,而是被放置在某種語境中——餐桌上的談話和問卷調查、微博發帖和麵對麵的訪談,是完全不同的體驗。
SocioVerse就通過場景引擎,去模擬不同行為發生的“結構性環境”。
比如當它模擬“選舉投票行為”時,就會選擇匿名係統反饋。當它模擬“社交平台發言”時,要加入“會被誰看到”“評論如何反饋”的社交反饋機製。而當它模擬“用戶接受經濟調查”時,需要把問題置於是否信任問卷、是否擔心隱私等背景因素中。
在“國家經濟調查”這一模擬中,係統重建了一個與統計局高度一致的問卷環境——涵蓋食品、住房、醫療、交通、教育等八大項,並設置了不同的發放方式和媒介渠道。
結果顯示,當問卷從“政府官網”發出時,虛擬智能體普遍持“慎重”、“合規”態度。而他們在答題時也更傾向中性回答、謹慎表達負麵意見。
而同樣的話題從“小紅書推薦博主”發出時,虛擬智能體則更容易將其當作“社交參與”或“生活方式表達”。也更容易在回答中真實反饋支出痛點、表達焦慮或消費偏見(例如“最近醫療真的太貴了”“房租太高撐不住了”)。
這意味著,它確實模擬了信息裹挾的情境。而非僅僅用AI模擬了聊天。
第四步,互動維度:信息傳播的連鎖反應
情景造好後,下麵就是通路模擬。信息進入通路,然後把“個體”變成“彼此相關的個體”。SocioVerse稱這個為行為引擎。
這一引擎采用了雙軌係統。對於規則清晰的群體性行為,比如投票、選擇、點讚等,SocioVerse采用了成熟的傳統Agent-Based
Modeling(ABM)建模;而對於語言表達、態度生成、情緒反應等複雜互動,則調用大語言模型生成,給予每個Agent其“人格+曆史+信息輸入+場景位置”,生成其行為。
以特朗普發表演講為例,係統不僅能生成智能體對事件的初始態度,更能模擬其在社交平台的發帖行為、信息傳播路徑及引發的連鎖反應。從意見領袖的率先發聲,到普通用戶的跟風討論,再到觀點對立引發的輿論極化,每個環節都在算法驅動下層層遞進,完整複現現實世界中熱點事件從萌芽到爆發的全生命周期。
值得注意的是,行為引擎的核心並非簡單複刻行為本身,而是構建一個閉環的信息生態係統。在這裏,每個智能體的言論都可能經曆“傳播-誤讀-再創作-擴散”的循環,如同現實社會中的謠言發酵或熱點炒作,讓虛擬世界產生與真實社會同步共振的輿論漣漪。
雖然這個引擎名為行為引擎,但SocioVerse模擬的不隻是行為本身,更是行為被看見、被誤讀、被引用以及引發反應的信息循環機製。
當社會環境引擎注入實時事件、用戶引擎定義角色特征、場景引擎設定交互規則、行為引擎激活動態反饋,四大模塊共同驅動著SocioVerse的數字社會模型。
這個係統不僅能感知時間的流動、識別個體的差異、還原場景的真實,更能捕捉人與人之間微妙的影響鏈條,最終構建出一個充滿生命力的數字孿生社會。
驚人的預測能力:三個真實世界模擬的震撼結果
單看整套係統的設計,SocioVerse基本上做到了對人作為社會分子,其所受的核心影響因素做了深入毛孔的拆解。
也正是因此,SocioVerse展示了相當準確的預測真實世界行為的能力。
他們一共進行了三組實驗,都相當準確。
第一組是美國總統選舉預測。研究團隊構建了一個包含33萬多個虛擬選民的模型。其中每個虛擬選民都具有12個關鍵人口統計特征。他們使用迭代比例擬合技術確保這些虛擬選民的分布與美國各州的真實人口分布一致。隨後,他們設計了一份包含49個問題的詳盡調查問卷,涵蓋從社會安全到LGBTQ+權利的各種政治議題。
結果在使用Qwen2.5-72b模型時,係統在所有州的預測準確率達到了92.2%,而在關鍵搖擺州的準確率也高達80%。根據現實中美國“贏者通吃”的選舉人票分配規則,這意味著AI幾乎可以完美預測整個美國總統選舉的結果。
第二組則是突發新聞反饋分析——在這個場景中,研究者以ChatGPT的發布作為目標事件,嚐試預測公眾對這一技術突破的反應。他們首先界定了潛在受眾群體(對技術感興趣的小紅書用戶),然後從用戶池中采樣了2萬個智能體,基於ABC態度模型(情感、行為、認知)設計了一份18個問題的問卷,覆蓋公眾認知、感知風險、感知收益、信任、公平和公眾接受度六個維度。
結果AI智能體的反應與實際用戶的反應高度一致,甚至在細微的觀點分布上都表現出驚人的相似性。GPT-4o模型模擬的結果在KL散度指標上的得分僅為0.196,意味著預測分布與真實分布幾乎重合。
第三個實驗是中國國家經濟調查——這一模擬展示了係統在經濟行為預測方麵的能力。研究團隊根據中國國家統計局的方法論,從用戶池中采樣了1.6萬個智能體,涵蓋全國31個地區。他們精心設計了一份經濟問卷,詢問關於食品、服裝、住房、日用品、交通通訊、教育娛樂、醫療保健和其他七大類消費的具體支出情況。
當模擬結果與官方統計數據比較時,所有測試的AI模型都展現出令人難以置信的準確性,尤其是在發達地區的表現更為突出。Llama3-70b模型在所有消費類別上的均方根誤差低至0.026,意味著它能幾乎完美地複製中國居民的消費模式。
這三個實驗說明,SocioVerse確實已經成了一個能夠準確模擬和預測大規模社會現象的強大係統。從新聞反應到政策影響,幾乎沒有任何社會現象能超出其模擬範圍。
並非虛擬小鎮,而是虛擬現實
很多人會說這個邏輯和之前的斯坦福小鎮沒啥區別啊,隻是智能體數量擴大了,行為更多集中在信息交互上了。
確實,在SocioVerse之前,這類AI智能體社會模擬項目其實已經有過不少了。2023年末的“斯坦福小鎮”虛擬社區,這一試驗中讓25個AI智能體在這個封閉環境中生活和互動。
而上一個出圈的實驗是Project Sid
,他們把斯坦福小鎮拓展到1000人的水平,並且把場景換成了minecraft,那裏的智能體居民也逐步形成了社區和選舉。
但SocioVerse從本質上和這類實驗完全不同。
斯坦福小鎮與真實世界之間存在一道清晰的界限:它是一個完全封閉的虛構環境,所有角色都是人為創建的,沒有任何真實人類數據的直接輸入。它更像是一個精心設計的互動小說,而非真實社會的鏡像。
SocioVerse則完全不同。它直接建立在1000萬真實人類的行為數據之上,每一個智能體都不是憑空想象的角色,而是基於真實用戶的詳細檔案。
雖然研究者聲稱他們采取了保護用戶隱私的措施,如隻提取公開帖子內容並過濾異常數據,但這些措施並不能改變一個基本事實:SocioVerse正在從大規模真實人類行為中提取模式,並用這些模式來預測更廣泛群體的反應。它不是在一個想象的世界中進行試驗,而是在創建一個與我們共同生活的社會世界的“數字孿生”。
這種直接與真實世界對接的特性,使SocioVerse成為一種全新類型的社會工具——一個不僅能夠觀察和分析社會,還能夠預測甚至可能影響社會的係統。這不再是學術上的思想實驗,而是一種可能對現實世界產生深遠影響的技術。
小紅書,不應該在這裏出現
過去,當平台擁有了比較粗糙用戶數據時,他們用這些數據塑造了推薦算法,進而製造了達成平台利益最大化的信息繭房。而現在,當它擁有一個能夠如此準確地預測人類行為的係統時,會有什麽能阻止他們將其從預測轉向去影響群體的決策?
與傳統的社會工程或宣傳不同,這種新型影響更加精細、更加個性化、也更加難以察覺。它不是通過明顯的不實信息操作公眾,而是通過微妙地調整真實信息的呈現方式,放大某些方麵同時淡化其他方麵,以產生預期的心理和行為反應。
這就是無聲的控製,一根完美的牧羊杖。
擁有著AI助力的平台的能力遠遠超越了傳統的個性化推薦,進入了對集體行為和社會偏好的積極塑造領域。如果說信息繭房隻是針對個人的最大注意力抽取技術,那SocioVerse就將是對全社會的指揮棒。平台可以隨意的指點,而我們則隻能在不知覺的情況下隨之起舞。
而這項研究,恰好就是不僅由學術機構主導,而且有小紅書的參與。正是依靠著這家擁有上億用戶的社交媒體巨頭,這些真實數據才有可能被獲取。
而有了這套係統。我們在平台上的意見,和呼喊不再會是需求本身。而隻不過是係統捕捉到的,可利用以達成它個體目的的信息而已。
這無可反擊的意誌,世界上最強大的政客和民意操作者,正在實驗室中誕生。
這可能是AI時代,我們所麵對的最壞的可能。