亞倫森教授反戈一擊 挑落“九章”量子霸權
作者:徐令予
2020年底,中科大的“九章”團隊宣稱他們研製的光量子計算機取得了“量子優勢”,很快國際上就有一些專家學者對此提出了批評和質疑[1]。但是批評者們大多隻是謙謙君子,動口不動手,唯有穀歌量子計算理論部首席科學家 Sergio Boixo 與眾不同,他是既動口來也動手,他帶領他的研究團隊設計製定了近似模擬算法和計算程序,在高斯玻色釆樣的質量和效率上全麵擊敗“九章”實驗設備。具體的算法和數據開布在今年9月的研究報告中[2]。
穀歌的研究成果無異於一顆重磅炸彈,讓玻色釆樣的教主斯科特·亞倫森教授再也按耐不住了,他仔細閱讀了穀歌的論文,並與穀歌的Sergio Boixo 和中科大的陸朝陽教授進行了認真的交流溝通,10月10日他發表一篇博文[3],反戈一擊挑落了“九章”的量子霸權。
亞倫森教授文章的核心可以歸結為兩點:
亞倫森教授是玻色釆樣理論的開山始祖、“九章”論文在《科學》上發表時的主審人。在玻色釆樣問題上沒有誰比亞倫森教授更權威了,也沒有任何人比他更希望玻色釆樣早日取得量子優勢,因此他對“九章”實驗結果的否定就是終審裁決。
亞倫森教授是玻色釆樣之父,玻色釆樣之果就是取得量子優勢,沒有一位父親不想早得貴子。亞倫森教授偏愛“九章”實驗是人之常情,但是作為一個科學家他更愛真理,他認理不認親,絕不護犢子。亞倫森教授科學之上的精神值得點讚!
為便於讀者更好地閱讀和理解亞倫森教授的原文,這裏先對玻色釆樣、量子優勢和和“九章”實驗作些科普介紹,有基礎的讀者可以直接跳轉至摘譯部分。
玻色釆樣實驗每次讓100個光子通過一個100x100的全連接光幹涉網絡,然後在100個出口,分別用單光子檢測器來檢測有沒有光子輸出,見下圖左側。每次實驗在200秒的時間之內,發射5000萬批次的光子,每個批次有100個光子。然後觀察100個通道出口的單光子檢測器中一共檢測到多少次光子,得到實驗結果,見下圖中間。把實驗得到的樣本數除上釆樣總數就是各種光子數出現的概率分布,見圖右側的紅色曲線(條件是釆樣總數必須足夠多,這一點至關重要[4])。
玻色釆樣實驗得到的了一個分布曲線,曲線上的每一點對應於100個通道口檢測到某個光子數的概率,這個概率值可以把光子數作為自變量通過複數矩陣的積和式計算得到,積和式的精確算法是指數複雜度,因此當光子數足夠大時,目前的經典數值計算機是無能為力的,而且玻色釆樣一次實驗同時得到各種光子數的概率,畢竟玻色采樣就是一部釆樣機,這是玻色釆樣實驗的優勢所在。
但是有一點需要指出,玻色采樣得到的概率僅是一個釆樣的近似值,而超級計算機得到的卻是精確解,當計算程序編製調試通過後,它們在不同的超算上,在不同的時間地點上,在外界環境變化時,得到的計算結果都是一樣的,而玻色釆樣實驗就完全做不到這一點,同樣的實驗設備白天與晚上的結果都會不一樣,更不要說換一台設備了。所謂的量子優勢絕不表示玻色釆樣實驗設備運行積和式程序比超算更快,更準確地說,是用超算通過積和式數值解的方法模擬玻色釆樣效率太低。那麽是否存在對玻色釆樣實驗更為有效的數值模擬技術呢?答案是肯定的,這就是本文的核心。
對於有噪聲的“玻色釆樣”(BosonSampling)實驗確實存在更有效的經典模擬,量子計算理論專家 Gil Kalai 和 Guy Kindler 在2014年發表的一篇論文指出,給定一個光子分束器網絡,該網絡的“玻色釆樣”的分布也可通過逐級的分層模型作數值模擬逼近。
初淺地講,在第一級(k = 1),假設光子隻是經典的可區分粒子。在第二級(k = 2),模型精確模擬兩個光子相互之間的量子幹涉,但是沒有高階幹涉。在第三個級別(k = 3),模型精確地模擬了三個光子相互之間的幹擾,依此類推,直到 (k = n)(其中 n 是實驗中每次光子輸入的總數),這就能逐步逼近玻色采樣的理想分布。
穀歌的研究團隊在上述分層模型基礎上,針對中科大的“九章”2型設備設計製定了具體的近似模擬算法和計算程序,在釆樣的質量和效率上全麵超越“九章”。有關詳情可見他們近期發表的論文:《高斯玻色釆樣實驗的高效近似算法》。該論文簡直就是一篇針對中科大“九章”團隊的檄文,文章明確指出,複雜度僅為二次方的經典近似算法比“九章”實驗可以更精確地逼近理想的分布,因此“九章”的量子優勢就失去了科學依據。
下圖是該論文中的圖3。圖中的黑色點線和紫色虛劃線分別對應於理想分布曲線和“九章”釆樣的實驗結果,顏色為蘭、綠、橙、棕的直線分別為一級、二級和三級近似的經典模擬計算結果。從圖的上部可以看出,二級以上的近似計算結果更接近理論的分布曲線,圖片的下部顯示各種方法得到的結果與理論分布的統計偏差曲線,從中不難看出“九章”采樣實驗結果與理論分布之間的偏差遠大於二級近似的計算結果。
實驗釆樣和近似計算的結果誰更接近於理想分布呢?在上段文字中我們兩次使用了“看出”一詞,這顯然不夠科學,穀歌的論文中使用了一個客觀指標:“總變差”
“總變差” (Total Variation Distance )通常是用來衡量兩個概率分布之間的相似性和差異的,在應用中它雖不及 KL 距離那麽廣泛,但是在理論分析中用的比較多。兩個分布的“總變差”越小則表示這兩個分布很接近,或者說很一致。
從數據來看,與理論分布相比,穀歌的近似模擬算法的“總變差”小於“九章”實驗結果的“總變差”,換言之,穀歌的近似模擬算法得到的釆樣結果比“九章”實驗的結果更接近於理論分布。而穀歌的近似模擬算法僅是二次方計算複雜度,因此在高斯玻色釆樣上它比“九章”可以做得更快更好,“九章”的量子優勢就是子虛烏有。
對此,亞倫森教授一針見血地指出,玻色釆樣就是做采樣的,它的名字就說明了一切!釆樣得到的分布能否逼近理想分布是檢驗釆樣結果的唯一標準,如果穀歌的近似算法在逼近理想分布上做得比九章實驗更好,那麽一切爭論都是多餘的。
“總變差”這個評價指標就是懸在中科大“九章”團隊頭頂的達摩克利斯之劍。在嚴峻的技術挑戰麵前,中科大團隊缺乏“紮硬寨,打死仗”的決心和本事,隻想迂回躲閃走偏路,他們拒絕把“總變差”作為主要的評價指標也屬意料之中,這與他們從事量子通信工程化以來的行事風格相當一致。
為了把水攪渾,中科大團隊避而不談“總變差”,卻在“高階相關性”上大做文章,他們批評穀歌的近似算法隻做了2階和3階相關性的近似模擬,宣稱他們的實驗涉及到19階相關性。
但是他們卻不敢承認這樣兩個事實:第一個事實是 k 階相關性對分布的貢獻按 1/exp(k) 指數式下降。第二個事實是,釆樣實驗結果在 1 階和 2 階相關性上已經與理想分布存在明顯偏差。
“九章”實驗設備就像一隻蹩腳照像機,拍出的照片嚴重失真,卻一味的誇耀自己像素有多高,實在令人啼笑皆非。
對於“高階相關性”問題亞倫森教授的批評更為尖銳:難道中科大的九章實驗真的在“高階相關性”這個指標上做得更好嗎?如果中科大的“九章”團隊非要修改比賽規則,但在新規則下仍然輸了比賽,那將是極為尷尬的。看來亞倫森教授真的生氣了,不知中科大團隊的某些人這次是否真能接受批評、迷途知返。
總之,穀歌最新的論文否定了“九章”取得量子優勢,並且得到了玻色釆樣理論創始人兼“九章”論文審稿人亞倫森教授的背書。亞倫森教授文章的最後為玻色采樣的未來作出了新的規劃,他認為玻色采樣要真正取得量子優勢必須在以下二個方麵同時取得突破:
1)在實驗方麵,重點是提高采樣數據的保真度(Fidelity),而不是一再擴大實驗係統的規模(Hilbert space);
2)在理論方麵,需要找到能夠有效地驗證實驗結果正確性的標準和方法。
亞倫森教授不愧是玻色采樣的祖師爺,他對玻色采樣目前存在的問題看得一清二楚,點到了“九章”實驗的死穴上了。目前“九章”高斯玻色采樣實驗數據的保真度比經典近似模擬算法差很多,而且在高光子數的區間的實驗結果也根本無法驗證,在這種情況下,宣稱“九章”已經取得量子優勢實在為時過早。
更令人不可思議的是,中科大某些人明知“九章”的釆樣結果與理論分布差距甚大,特別是在決定性能的高光子數區間的實驗結果無法驗證的情況下,仍然在媒體上公開宣傳“九章”比超算要快“億億億”倍,這已經很難用“錯誤”做遁詞了,這種不負責任誤導公眾的行為已經嚴重突破了做人的底線。
“ Quantum Supremacy ”原意就是“量子霸權”,為了政治正確現在都用“量子優勢”替代了。其實“九章”從未真正取得過量子優勢,卻非要說已經取得量子優勢,還不容他人批評質疑,“九章“是量子優勢全無而量子霸權十足。清除“九章”問題上某些人的霸權思維才是這此爭議的要害所在,所以本文的題目取為:《亞倫森教授反戈一擊 挑落“九章”量子霸權》
亞倫森教授2021年10月10日博文摘譯
(…… )。如果經典模擬算法在與理想分布的“總變差”這個指標上擊敗玻色采樣實驗,那就沒有必要再為正確再現高階相關性這個指標操心。
確實,目前有噪聲的玻色采樣實驗是建立在兩個事實的基礎上的。第一個事實是 k 階相關性對分布的貢獻按 1/exp(k) 指數式下降。第二個事實是,由於校準錯誤等原因,釆樣實驗結果在 1 階和 2 階相關性上已經與理想分布存在明顯偏差。
把這些事實放在一起,你會發現什麽?經典模擬算法僅考慮低階相關性貢獻後得到的分布完全正確。單憑這一點,它已經勝過了有噪聲玻色釆樣實驗,作出這個判斷的指標就是與理想分布的“總變差”或“線性交叉熵”。是的,玻色釆樣實驗在高階相關性這個指標上將勝過經典模擬。但由於這些高階相關性無論如何都會呈指數衰減,因此它們不足以勉回總體的評估。玻色釆樣實驗在低階相關性上的不完美是致命傷。
(Now for the kicker: it seems that Hypothesis H is false. ) A classical spoofer could beat a BosonSampling experiment on total variation distance from the ideal distribution, without even bothering to reproduce the high-order correlations correctly.
This is true because of a combination of two facts about the existing noisy BosonSampling experiments. The first fact is that the contribution from the order-k correlations falls off like 1/exp(k). The second fact is that, due to calibration errors and the like, the experiments already show significant deviations from the ideal distribution on the order-1 and order-2 correlations.
Put these facts together and what do you find? Well, suppose your classical spoofing algorithm takes care to get the low-order contributions to the distribution exactly right. Just for that reason alone, it could already win over a noisy BosonSampling experiment, as judged by benchmarks like total variation distance from the ideal distribution, or for that matter linear cross-entropy. Yes, the experiment will beat the classical simulation on the higher-order correlations. But because those higher-order correlations are exponentially attenuated anyway, they won’t be enough to make up the difference. The experiment’s lack of perfection on the low-order correlations will swamp everything else.
當然,我仍然不確定會發生什麽— 是否能將“總變差”的判斷標準外推到全部 144 模式中,這取決於我是相信(穀歌的)Sergio Boixo 還是(中科大的)陸朝陽,(在這一點上我有些難以取舍)。但我現在看到(穀歌的判斷)在邏輯上是可能的,甚至可能是合理可信的。
Granted, I still don’t know for sure that this is what happens — that depends on whether I believe Sergio or Chaoyang about the extrapolation of the variation distance to the full 144 modes (my own eyeballs having failed to render a verdict!). But I now see that it’s logically possible, maybe even plausible.
穀歌可以說:玻色釆樣的創始人斯科特·亞倫森(Scott Aaronson)在上周晚些時候認為用一個指標—即與理想分布的“總變差”,就完全足夠做出評判,那麽我們就贏了。我們實現了比中科大九章實驗更低的“總變差”,我們使用了快速的經典算法。爭議結束。落棋不悔,方為君子。
穀歌還可進一步強調:玻色釆樣是一個采樣任務,它的名字說明了一切!釆用任何判斷標準的唯一目的—無論是線性 XEB 還是高階相關性,都是為了判定你的釆樣結果能否逼近理想分布。這就意味著,如果承認我們在逼近理想分布上做得比九章實驗更好,那麽就再也沒有什麽可爭論的了。
Google could say: by a metric that Scott Aaronson, the coinventor of BosonSampling, thought was perfectly adequate as late as last week — namely, total variation distance from the ideal distribution — we won. We achieved lower variation distance than USTC’s experiment, and we did it using a fast classical algorithm. End of discussion. No moving the goalposts after the fact.
Google could even add: BosonSampling is a sampling task; it’s right there in the name! The only purpose of any benchmark — whether Linear XEB or high-order correlation — is to give evidence about whether you are or aren’t sampling from a distribution close to the ideal one. But that means that, if you accept that we are doing the latter better than the experiment, then there’s nothing more to argue about.
中科大九章團隊可能會做出回應:即使斯科特·亞倫森(Scott Aaronson)是玻色釆樣的創始人,他也遠非是絕對可靠的預言家。在這個現實案例中,他對實驗中的錯誤來源缺乏認識,導致他不恰當地將“總變差”作為判斷成敗的唯一指標。如果你想看到我們係統中的量子優勢,你必須忽略低階相關性而更多地關注高階相關性。
中科大團隊也可補充:從一開始,量子優勢實驗的重點就是在某個標準上展示明顯的加速—我們從不特別關心是哪一個指標!一開始當我們談論到量子優勢時,習慣己成自然 — 穀歌團隊自己在 2019 年秋季報告第一次量子優勢實驗時,同樣用的是一個完全人為的標準,這是眾人皆知的事實。(Google 團隊甚至有調整標準的先例,例如,當 Pan 和 Zhang 指出最初指定的 Linear XEB 很容易被隨機 2D 電路模似時,他們的反駁就是:好,那就這樣吧,添加一個額外檢查使得返回的樣本彼此足夠的不同,這就秒殺了 Pan 和 Zhang 的模擬策略。)那麽憑什麽針對高階相關性量身定製的指標就一定不如“總變差”或“線性交叉熵”或任何其它指標呢?
USTC could respond: even if Scott Aaronson is the coinventor of BosonSampling, he’s extremely far from an infallible oracle. In the case at hand, his lack of appreciation for the sources of error in realistic experiments caused him to fixate inappropriately on variation distance as the success criterion. If you want to see the quantum advantage in our system, you have to deliberately subtract off the low-order correlations and look at the high-order correlations.
USTC could add: from the very beginning, the whole point of quantum supremacy experiments was to demonstrate a clear speedup on some benchmark — we never particularly cared which one! That horse is out of the barn as soon as we’re talking about quantum supremacy at all — something the Google group, which itself reported the first quantum supremacy experiment in Fall 2019, again for a completely artificial benchmark — knows as well as anyone else. (The Google team even has experience with adjusting benchmarks: when, for example, Pan and Zhang pointed out that Linear XEB as originally specified is pretty easy to spoof for random 2D circuits, the most cogent rejoinder was: OK, fine then, add an extra check that the returned samples are sufficiently different from one another, which kills Pan and Zhang’s spoofing strategy.) In that case, then, why isn’t a benchmark tailored to the high-order correlations as good as variation distance or linear cross-entropy or any other benchmark?
為了進一步論證的需要,假設我們接受了中科大的立場,並且我們認同中科大的九章實驗取得了量子優勢,如果“九章”實驗在再現高階相關性方麵確實比任何已知的經典模擬做得更好。但我們仍然麵臨一個問題:難道中科大的九章實驗真的在該指標上做得更好嗎?如果中國科學技術大學贏得了可以單方麵修改遊戲規則的權利,但即使在新規則下仍然輸了比賽,那將是極為尷尬的。
OK, but suppose, again for the sake of argument, that we accepted the second position, and we said that USTC gets to declare quantum supremacy as long as its experiment does better than any known classical simulation at reproducing the high-order correlations. We’d still face the question: does the USTC experiment, in fact, do better on that metric? It would be awkward if, having won the right to change the rules in its favor, USTC still lost even under the new rules.
那麽,為什麽我們沒有 19 階相關性的直接數據呢?問題很簡單,它會讓中科大花費天文數字的計算時間。因此,他們隻能依賴於觀察到的低階相關性數據的統計外推—我們再次進行外推!當然,如果我們不讓穀歌作合理的外推,但是又放任中科大可以作相同的事情,那與遊戲又何區別?
So then, why don’t we have direct data for the order-19 correlations? The trouble is simply that it would’ve taken USTC an astronomical amount of computation time. So instead, they relied on a statistical extrapolation from the observed strength of the lower-order correlations — there we go again with the extrapolations! Of course, if we’re going to let Google rest its case on an extrapolation, then maybe it’s only sporting to let USTC do the same.
對於量子優勢實驗的未來,有三個目標比以前更為緊迫。
1)對於采樣實驗,提高設備的數據保真度(例如,對於玻色釆樣,觀察高階相關性對分布的貢獻)— 從戰勝經典模擬算法的角度來看,這比進一步增加希爾伯特空間維度更為緊迫。
2)從理論上講,要製定更好的標準,使得可以用經典算法對基於采樣取得量子優勢的實驗結果進行驗證 — 理想情況下,該經典算法應該是多項式複術度。
3)特別是高斯玻色釆樣,應更好地了解經典模擬算法的合理邊界,以及有噪聲的量子設備需要達到怎樣的數據保真度才能超越這些邊界。
In the end, then, I come back to the exact same three goals I would’ve recommended a week ago for the future of quantum supremacy experiments, but with all of them now even more acutely important than before:
參考資料
[2] 高斯玻色釆樣實驗的高效近似算法
[3] 亞倫森教授10月10日的博文
[4] 基於量子隨機的玻色采樣行為級模擬
我同意你的觀點,世界各國的量子計算研究基本上都是忽悠,不過中國的忽悠騙的都是政府的錢,性質更惡劣。
謝謝關注留言。
謝謝關注留言。
謝謝關注留言。
打不打臉不重要,
沒人願意打那些說假話的人的臉,怕髒了g手。
前有畝產萬斤,今有量子研究第一,
革命自有後來人,嗬嗬
中國人被打臉,博主興奮不已,浮表字麵,爽呀!
---------------------
文學城這樣的人不少,可能美國的漢堡吃多了。