餘命

來源: meowzilla 2014-06-06 11:40:17 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (13992 bytes)
原作:佚名/日本網友

編譯:StarKnight

這個故事並非什麽能把人嚇到屁滾尿流的恐怖鬼故事,隻不過偶爾回想,還是令人脊背發涼,所以不妨寫下,供諸君一閱。

已經是好幾年前的事了。當時,我是一家企業的研究團隊的一員。

說是研究員,但並非穿著白大褂、調試各種藥劑的那種研究——我們做的是基於監控錄像的人臉識別係統,及其相關應用。

比方說,在電腦主機上搭建一個程序,然後向它輸入大量的監控攝像頭數據,最終,程序通過人臉識別,輸出諸如「ID:0001 ,通過點:X→Y→Z」這樣的記錄(log)。

當然,這種程度的功能,市麵上已經多得很了,我們要做的是,嚐試在此基礎上,逐漸追加各種功能,看能不能獲得什麽意外成果。

最先開發的是「年齡判斷」功能——大概不少人聽說過。

基本原理和天氣預報差不多:預先在係統內存儲數千組人臉/年齡的數據,當攝像頭讀取到動態的人臉時,基於預存的數據,給出一個預想值。

這個方法不算複雜,但精度卻不低。在試驗階段,就能猜中40%左右,其餘的誤差保持在±8歲之內,很有意思。

但若僅是「年齡判斷」功能,也已經有不少地方在做,於是我們繼續努力,想做出一點更加獨特的功能來。

幸好,我們研究室手頭有不少原始資料,包括人物的照片,名字,年齡,籍貫和學曆,等等,可供我們做各種試驗。

猜名字的功能我們放棄了。那麽離散的數值讓電腦來猜,委實有點困難。

令人驚訝的是,「看人臉猜學曆」(學曆分為四檔:初中/高中/普通大學/一流大學畢業)竟然有高達60%的準確率。

「看人臉猜籍貫」(讓電腦將衝繩-北海道作為一個連續的值來判斷),則有將近10%的準確率。

——可能有人會想:「什麽啊,才10%而已?」但這其實是個很了不得的比率。

讓人看臉猜年齡,準確度也許超過電腦,但光看臉猜別人的籍貫,10次中未必能中1次。

總之,這裏想說的是,隻要給予電腦足夠多的樣本,程序的推算精度還真的不容小覷。

閑話少敘,書歸正傳。

當時,正是《死亡筆記》正流行的時候。可能是受了這部作品的影響,我們團隊裏一個喜歡異想天開的「瘋狂科學家」(姑且稱他為A吧),提議說:「我們來做做看壽命預測吧」。

顯然,我們手頭的照片資料內,是不可能有「剩餘壽命:XX年」這一欄的。

A說:「我們可以用曆史人物的照片。有些是黑白的,應該不會對識別精度有太大影響,沒關係的。」

確實,黑白照片的識別精度雖沒有彩照來得高,但對人臉識別程序的影響不會太大。

「不過,光用曆史人物照片,樣本數恐怕不夠吧?」

「不一定非要是名人,隻要有大頭照,攝影年份+死期就可以了啊,所以天災或者事故的死者也可以拿來用的。」

「等等……那豈不是會混進去很多因為外部原因而死的樣本?」

「沒關係,要的就是這個效果!」A笑眯眯地說。

——原來這家夥想要的效果,不是「通過對象麵貌,推定其健康程度,進而預測其壽命……」而是想讓電腦完成擺攤算卦的相麵先生的工作。

我對於拿死人的數據來做樣本這事兒,多少有點抵觸,但那時大家都是好奇心旺盛的年輕人,於是馬上就動手開始做了。

每天一點一點地將照片、死亡年份-照片拍攝年份(=剩餘壽命)的數據錄入電腦,過了幾個禮拜,樣本數達到了2000多個。

於是,我們進入了實驗階段。說是實驗,但因為不知道正確答案是多少,誰也沒法驗證其是否真的準。

第一個實驗對象是我。大家啟動了係統,讓我站在攝像頭麵前。

很快,攝像頭找準了我的麵部,隔了幾秒,係統畫麵上彈出了一個答案:

餘命:60。

嗯,現在日本男性的平均壽命大概是80來歲,這個答案也不算那麽離譜嘛。

(忘記說了。我們團隊裏的成員都是二十來歲,隻有組長三十掛零)。

接著,其他組員也都拍了照,得出了各種結果。

可能是因為樣本數還是不夠多,答案差異非常之大:

23、112、75、42……有些實在太離奇了。

其中最刺激的結果是A,他的測算結果是「0」。

看起來,實驗是失敗了。讓電腦做算命先生的活,還是力不從心。

不過那2000多個樣本是大家辛辛苦苦手動錄入的,自然要看看能不能在別的地方派點用場。

於是,我們將程序調整到log記錄模式,然後將公司服務器上保存著的各種監控錄像數據導了進去。

數據導入花了一整晚。第二天,電腦輸出了數千個辨識log。

我們將log數據作了一番統計處理,發現了一些有趣的現象:

隨監控場所的不同,餘命的數據差別也非常之大。

比如說,小學的場景,電腦推算出的登場人物餘命均值是「106」。

這個數字遠遠超過全部記錄的均值「46」。

相反,低於該均值的數據來源,則是高速公路的服務區監控錄像:平均值為「38」。

這是不是說明,開車或坐車的人,早死的風險比較大?

按照由多到少的順序往下翻,倒數第二位的,是本地的一所養老院的錄像,平均值為「15」。

倒數第一位呢? 如你所猜想的,是醫院。平均值居然隻有「4」!

等等,好像不大對啊。就算是醫院的錄像,平均餘命隻有4年也太不自然了。

比如說,住院患者中一定有因為參加體育活動受傷的少兒吧,他們的餘命應該很長才對。

為了確認是不是什麽地方出了差錯,於是我們調取了原始數據。

一看,當時就驚著了。

原始數據的格式是這樣的:

「ID:1234 VALUE:34(← 在這裏,VALUE的值即為推定餘命) …」

像這樣一條條的數據在屏幕上排開,綿延不絕。大部分是很普通的數字,比如「34」或「50」等等。

可是,其中夾雜了幾個不可能存在的數——

負數。

以防萬一,我們調出醫院以外的原始數據來看,發現其他場所的log裏麵,也有幾個負數的記錄,但絕對數量比醫院少得多。

——如果按照字麵意義來解釋,即是「餘命=-3年」,也就是「已經死了三年」。

——所以,醫院裏探得的數據,負數特別多,所以導致餘命的平均值也大為下降。

……我們努力想要保持冷靜,但冷汗已經把衣服濕透了。

之後,團隊成員開了幾次會,覺得隻能得出兩個結論——無論哪一個都令人喪氣。

即,1)讓電腦測算餘命,誤差太大,沒有信服力;

或,2)我們的周圍,有餘命為負數的人在昂然闊步。

當然,最終我們采納了第一個結論。對於整個實驗,我們擬了一份報告,隨便起了一個《利用人臉辨識程序調查健康狀態的可能性》的名字,上交給了領導(這倒是事前就計劃好了的)。

這個項目就此打上封印。

我們每天都要與數百人擦肩而過,目光交錯。

誰知道其中有多少張臉,是「餘命為負」的?

還有一件重要的事情忘記寫了,補上。

被電腦推算出「餘命為0」後不到一年,A死了。

上班高峰期,他從站台上跳下了鐵軌。

電腦是怎麽預測出來的?

誰也搞不懂。

我們提供給電腦的信息,隻有「樣本」與「測算對象的臉」而已。

可是A確如電腦宣告的那般,如期死去了。

有一個詞,叫「死相」。

有些異能人士,看人的臉,就約莫能知道,「這個人快死了」。

我對超自然的事情不大感冒,但自從A死後,我開始非常害怕靠近監控攝像頭與擁擠的人群。

還有,隻要不是逼不得已,我也絕不靠近醫院。

<完>

所有跟帖: 

有意思。餘命是負數。 -笑含- 給 笑含 發送悄悄話 笑含 的博客首頁 (0 bytes) () 06/06/2014 postreply 16:43:21

因為人體放光,鏡頭是測光的。人命將盡,光也就暗了。 -astermatch- 給 astermatch 發送悄悄話 astermatch 的博客首頁 (0 bytes) () 06/06/2014 postreply 20:35:26

沒事別總算命。。 -Lionqueen - 給 Lionqueen  發送悄悄話 (0 bytes) () 06/07/2014 postreply 18:12:58

co.沒事別總算命。。。不過這餘命說法是少見,有點意思。 -玉珠- 給 玉珠 發送悄悄話 玉珠 的博客首頁 (0 bytes) () 06/13/2014 postreply 04:16:21

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”