百度鬧出的笑話
文章來源: 溪穀過客2016-06-03 12:05:58
這裏討論的既不是影響惡劣的魏澤西事件,也和臭名昭著的百度貼吧無關,而是一個不太為大眾所關心的名叫ILSVRC的人工智能競賽。
ILSVRC的英文全名叫做ImageNet Large Scale Visual Recognition Competition是人工智能領域內最高級別和最有影響力的物體識別競賽。競賽的形式很簡單:ImageNet 網站裏存放著多達1000種不同物體的照片,人工智能專家們把自己寫出的程序上傳到網站去識別照片上的物體。誰的識別率高,誰就獲勝。
近些年來,這項比賽的結果一直在不斷地高歌猛進。ImageNet的記錄顯示:在2012年,冠軍程序的出錯率為15.315%;僅僅兩年之後,當穀歌獲得該比賽冠軍的時候,其出錯率已經大幅度降低到了6.66%
2015113日,百度發表論文宣稱自己的出錯率下降到了5.98%,比當時的世界記錄低0.5%還多!
半個月後的26日,微軟發表論文宣稱自己的出錯率已經下降到了4.94%。這是一個極有意義的裏程碑,因為這個百分比已經比測試人類雙眼得到的出錯率還要低。
僅僅五天之後,也就是2015年的211日,穀歌再次發表論文聲稱自己的出錯率已經降到4.8%
2015511日,百度豪邁地告知世界自己的出錯率達到了4.58%,再次大幅度刷新世界紀錄!
然而令世人瞠目的是,到了201562日,ILSVRC突然取消了百度所保持的世界紀錄,同時宣布禁止百度參加此項比賽12個月。為什麽?因為百度違反了比賽規則。
ImageNet裏存放著大量不同物體的照片。這些照片分為兩類,一類是供開發用的,共有150萬張。這些照片任何人都可以隨便使用,沒有限製。
另一類則是為比賽專用的。為了使不同程序之間的識別率有可比性,此類照片數量較小(10萬張),每個參賽隊每周最多隻能使用兩次,作為最終檢驗程序性能所用。
這和高考、托福或GRE的考試原理一模一樣:模擬題、考古題不計其數。為了提高考試成績,考生完全可以使用題海戰術。你就是將模擬、考古題以“吾將上下而求索”的精神反複做上十萬遍,也沒人幹涉你的自由。但考試的真題可不能隨便讓你做的,否則考出的結果就會失真。
百度開發團隊的隊員是不是上述各類考試的高手不得而知,但他們的應對方法卻再一次彰顯了在應試教育環境下成長起來的國人的無窮智慧。
很明顯,百度團隊並不滿足於隻做模擬和考古題。他們知道,要想在考試中獲得高分,哪怕隻是對出題方向或考試範圍有所了解的話,都會讓自己在考試中處於更大的優勢。於是他們成立了很多很多的“虛擬團隊”。每個團隊的賬號每星期可以使用兩次,那麽隻要注冊30個賬號,每星期就可以神不知鬼不覺地測試60次了。
針對十萬幅照片去優化自己的程序,當然容易得多,出錯率也會降得更低。
我甚至猜想百度員工在成功地進行了60次測試後還會自鳴得意地嘲笑美國佬:太蠢了,設置有這麽大一個漏洞的規則,傻子才不去鑽這種空子呢!
問題是,美國佬並沒有他們想象的那麽傻,美國佬那有漏洞的規則其實是天網恢恢,疏而不漏。
ImageNet的官方網站上,ILSVRC的組織者宣布,自2014年的1128 2015年的513日之間,百度至少使用30個賬號進行了200多次測試。僅在2015315日至319日的5天內,他們就進行了多達40次的測試,遠遠超出了官方所規定的“每星期兩次”的要求。
重提這件發生於去年的陳年舊事,目的並不在於挖苦百度,更多的是想警戒自己。因為我發現,這種挖空心思想要鑽規則空子的行為和心理,在我們普通人身上(包括我自己在內)其實並不罕見。
不是嗎?當我們去餐館吃自助餐的時候,明明已經吃飽,卻總要再去灶台上弄些值錢的螃蟹腿或龍蝦之類的東西硬撐下去,即使知道這樣做隻會給胃增加難以承受的負擔。在商場購物的時候,已經跟商家砍價很多了,最後偏要申請一個信用卡做一次性支付,目的是在砍價的基礎上再得到百分之幾的折扣。當然,那個信用卡隨後會被我們及時取消。每當上網合約快要到期的時候,我們總會打電話給運營商要求取消計劃,然後用另外一個人的姓名要求重新加入,以便拿到為新客戶促銷的低廉價格。有時候這樣做並不見得真能獲得多少利益,隻是我們已經形成了一種慣性:這慣性使得我們對世間的一切空子極易敏感和興奮,一旦遇見便絕不會讓自己與它擦肩而過。
普通人擁有此類慣性並無大礙,最多也就被一些自命清高的人覺得沒修養,上不得台麵。然而以如此精神去研究人工智能,恐怕隻會斷送國人希望在此領域內領先世界的強國夢了。
百度被禁賽已滿一年,現在應該已經恢複比賽資格了。不過由此事件而造成的惡劣影響已經永久性地留在互聯網之上了。您要是不信,就請用 Baidu + Cheating 兩個關鍵詞去穀歌上搜一搜,看看能搜出什麽結果。
好奇之餘,我把上述兩個關鍵字送入了百度自己的搜索引擎。用英文關鍵字搜索,搜不出任何來自ILSVRC的原始文件和國外媒體對該事件的報道。用中文百度+作弊搜索,隻能搜到一些百度道歉以及開除該項目負責人吳韌之類的報道。令人大開眼界的是,其間居然還包含著一篇排名不低的百度其實沒有作弊的文章。
人工智能沒搞好,操控輿論的本領倒是練得駕輕就熟。
也許上述這些文字純屬小題大做。百度這點兒事算什麽?以嚴謹和敬業而著稱的德國人,不也同樣出了大眾“尾氣門”醜聞嗎?