特斯拉要實現完全自動駕駛,即SAE L5級別,僅依靠純計算機視覺(CV)技術目前是不可行的。
現在特斯拉的自動駕駛介於 L3,L4 之間,但是從 L2到L3,就是把駕駛事故的責任完全轉嫁到自動駕駛的車企上了,所以馬斯克死也不承認他的自動駕駛技術已經介於 L3 and L4.
L2:出事故:責任完全在司機
L3:出事故,主要責任在車企
僅依靠純計算機視覺(CV)技術目前是不可行的。下麵是我認為的三個核心原因。
感知局限性
純視覺係統存在固有的技術局限性,使得其無法在所有環境下都可靠地感知世界:
-
對環境的依賴性高: 像人眼一樣,攝像頭依賴光線。這意味著純視覺係統在惡劣天氣(如大雨、大雪、濃霧)和弱光條件下(如夜晚或太陽眩光)的感知能力會顯著下降,甚至完全失效。報告指出,即使是髒汙的攝像頭鏡頭也會影響係統性能。
-
深度和距離測量不精確: 與激光雷達或毫米波雷達不同,攝像頭很難精確測量物體在遠處的距離和深度。雖然可以通過訓練神經網絡來推斷,但這種推斷缺乏其他傳感器固有的硬件級精度,無法滿足L5級別係統所需的普遍可靠性。
-
缺乏冗餘: 純視覺係統缺乏傳感器冗餘,這意味著一旦攝像頭係統因任何原因(如光線、天氣或硬件故障)失靈,就沒有其他備用傳感器來提供安全保障,這會帶來災難性後果。
“邊緣案例”困境
即使擁有海量的真實駕駛數據,也無法解決自動駕駛麵臨的“邊緣案例”問題,而L5級別係統必須能處理所有情況:
-
數據驅動模型的根本局限: 純視覺係統隻能從它所接觸過的數據中學習。盡管特斯拉擁有數十億英裏的駕駛數據,但這仍然是有限的、曆史性的記錄。係統無法為它從未見過、不可預測的突發事件做好準備,而這是任何數據驅動模型的根本缺陷。
-
無法應對“新穎”場景: L5級別的係統必須能夠處理任何可以想象到的場景,而不僅僅是常見的場景。依賴曆史數據訓練的係統很難為前所未見的複雜情況做好準備。
監管和法律鴻溝
特斯拉在推廣其純視覺技術時麵臨監管和法律上的挑戰,這暴露了其技術與實際能力之間的差距:
-
品牌命名誤導: “全自動駕駛(Full Self-Driving)”這樣的名稱會給消費者帶來一種虛假的安全感,讓他們誤以為係統可以處理所有情況,從而導致危險的過度依賴。特斯拉將係統官方歸類為L2級別,這與它所宣傳的能力相矛盾,也讓它得以規避更高級別自動駕駛所需的嚴格監管和測試。
-
安全隱患: 特斯拉的幾次Autopilot的致命事故,這些事件都暴露了純視覺係統在識別固定障礙物等場景時的缺陷。這表明,一個真正安全的L5係統必須能夠完美地處理係統故障和用戶疏忽,而純視覺係統尚未達到這一要求。
總而言之,雖然純視覺方法具有成本效益和可擴展性的優勢,但它在感知、可靠性和安全性方麵麵臨著根本性的技術障礙。相比之下,采用多傳感器融合方法的公司(如Waymo)通過犧牲可擴展性和成本來換取硬件冗餘和可靠性,從而在商業上走上了一條更安全、更可行的道路,特別是在L4級別(高度自動化)的有限區域應用中。