個人資料
tiantianlu02 (熱門博主)
  • 博客訪問:
正文

偉大的A.I.覺醒 (一)

(2017-01-02 22:59:15) 下一個

偉大的A.I. 覺醒

Google如何使用人工智能來轉換它最熱門的服務Google翻譯以及機器學習如何重塑計算本身

BY GIDEON LEWIS-KRAUS

紐約時報2016 12月14日

序言:你就是你的閱讀

11月初的一個星期五晚上,東京大學人類計算機互動的著名教授Jun Rekimoto在準備一個演講,當他開始注意到網上社交媒體上滾動的一些奇怪的帖子。 突然之間,穀歌翻譯,穀歌熱門的機器翻譯服務,有了幾乎不可思議的改進。 Rekimoto訪問了穀歌翻譯本身,開始實驗。 他很震驚。 他必須去睡覺,但是穀歌翻譯牢牢地抓住了他的想象力。

Rekimoto把他的初步發現寫在了在一篇博客中。 首先,他用這個新的Google翻譯能比較了從兩個版本的“了不起的蓋茨比”,Takashi Nozaki的1957年翻譯和Haruki Murakami的新版本中的幾個句子。 Murakami的翻譯用了“相當精致的日語”,Rekimoto後來在電子郵件中向我解釋,文風是獨特的“村上風”。相比之下,穀歌的翻譯 - 盡管有一些“小的不自然” – 給他的感覺“更清晰 “。

Rekimoto的後半部分博客從另一個方向檢驗了翻譯服務,從日語到英語。 他匆匆翻譯了海明威的“乞力馬紮羅山的雪”的開篇,然後通過穀歌翻譯成英語。 他把這個翻譯和海明威的原作放在一起,然後邀請他的讀者猜一猜哪一段是機器翻譯的。

NO. 1:

Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

NO. 2:

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

甚至對於以英語為母語的人來說,豹子沒有介詞是唯一露餡的地方,第2號是自動機的產物。對Rekimoto來說兩者高度的一致性是一個奇跡,Rekimoto非常熟悉以前翻譯服務的能力。 在24小時前,Google隻能翻譯相同的日語段落如下所示:

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.

Rekimoto在Twitter上向他的十萬多個關注者推送了他的發現,在接下來的幾個小時,成千上萬的人推送了他們自己在機器翻譯服務上的實驗。 有些是成功的,有些是為了搞笑。隨著東京黎明破曉,穀歌翻譯成了日本Twitter上排名第一的流行話題,甚至超過一些熱追的動漫係列和一個女子超偶像樂團期待已久的新單曲。 每個人都想知道:Google翻譯如何變得如此詭異地精準?

四天後,來自世界各地的幾百名記者,企業家和廣告客戶聚集在Google的倫敦工程辦公室等候一個特別公告的發布。 客人收到了穀歌翻譯品牌的幸運簽語餅。 裏邊的紙條一麵是一個外語短語 -- 我的是挪威語 -- 另一麵是邀請下載翻譯應用程序。 桌子上放置了一盤盤的甜甜圈和冰沙,每個都有標簽告訴你它的味道,德語(zitrone),葡萄牙語(baunilha)或西班牙語(manzana)。 過了一會兒,每個人都給帶到了一個黑絲絨劇場。

倫敦市長Sadiq Khan站起來做開場白。 一個朋友最近告訴他說他讓人想起穀歌。 “為什麽,因為我知道所有的答案?”市長問。 “不,”朋友回答說,“因為你總是試著完成我的句子。”聽眾禮貌地點著頭。 Khan接著介紹Google的首席執行官Sundar Pichai走上舞台。

Pichai是來倫敦分部為穀歌的新建築,一個正在Kings Cross修建中的新“知識區”的基石奠基,另一方麵是為了揭示他去年宣布的公司轉型的初始階段的完成。Pichai曾多次說過 Google的未來會是“A.I. 第一“。這意味著什麽,從理論上來說很複雜,並且受到了很多猜測。 在實踐中,如果運氣好的話,很快公司的產品將不再代表傳統計算機編程的果實,而是“機器學習”。

成立於五年前的Google Brain是公司內部的一個高冷部門,它基於這樣一個原則:人工的“神經網絡”通過試錯來熟悉世界,就如幼兒做的,它可能會發展出類似人類的靈活性。這個概念不是新的 -- 它的一個版本可以追溯到20世紀40年代的現代計算的最早階段 -- 但在它的大部分曆史上,大多數計算機科學家認為它不靠譜,甚至是神秘的。自2011年以來,Google Brain已經證明這種人工智能的方向可以解決許多耗時幾十年的用傳統方法無力解決的問題。在Google Brain重新改造之前,語音識別做得並不好; 機器學習的應用使其在穀歌的移動平台Android上的性能變得幾乎和人類記錄一樣好。圖像識別也是如此。不到一年前,Brain第一次開始對整個產品進行內部改造,今天晚上是慶祝其巨大的成果的時候。

穀歌翻譯在2006年首次亮相,從此成為Google最可靠和最熱門的資產之一; 它每月為超過5億的不同語言的用戶提供每天140億字的服務。 它不僅是一個獨立的應用程序,而且是Gmail,Chrome和許多其他Google產品不可分割的功能,我們把它作為一個按鈕,一個我們的數字商務無摩擦,自然的一部分。 隻有在難民危機中,Pichai在講台上解釋說,公司才意識到穀歌翻譯的地緣政治重要性:在他身後的屏幕上出現了一個曲線圖,其陡峭的曲線表明阿拉伯語和德語之間的翻譯最近增加了五倍。 (它也在Pichai的心裏占很重地位,他在印度長大,一個有幾十種語言的地方。)翻譯團隊一直在穩步增加新的語言和功能,但在過去四年裏質量的提高已經大大減慢了。

直到今天。 截至上個周末,穀歌翻譯的大部分流量已經轉換為基於AI的係統,不僅在美國,而且在歐洲和亞洲:推出了包括英語和西班牙,法語,葡萄牙語,德語,中文,日語,韓語和土耳其語之間的翻譯。 其他一百多種語言的翻譯也快了,目標是到明年年底每月8個。這個讓穀歌自己的工程師也倍感驚喜的新版本隻花了九個月就完成了。 A.I. 係統已證明過這一夜之間的改善大致相當於老版本在其整個生命周期內的累積。

Pichai熱衷於晦澀的文學隱喻; 一個月前在加利福尼亞州山景城的辦公室他告訴我,翻譯存在的部分原因是因為不是每個人都可以像物理學家羅伯特·奧本海默通過學會梵語讀原文的Bhagavad Gita。 在倫敦,在他身後的監視器上的幻燈片閃出Borges的話:“Uno no es lo que es por lo que es,sino por lo que haleído。Pichai笑著朗讀一個由舊的翻譯係統翻的笨拙的英語版本:“One is not what is for what he writes, but for what he has read.” (一個不是他寫的東西,而是你讀到的東西),右邊是一個新的A.I.版本:“You are not what you write, but what you have read.” (你不是你寫的,而是你讀的)。這是個貼切的評語:在某種意義上,新的Google翻譯運行在第一台學會了讀任何東西的機器上。

在工業界機器學習的狂想中,Google決定圍繞A.I.重組自己的決定是第一個重要的宣言。在過去的四年中,尤其是穀歌,Facebook,蘋果,亞馬遜,微軟和中國百度等六家公司已經開始了A.I.的軍備競賽。人才,特別是在大學內。企業對資源和自由的承諾稀釋了頂尖的學術院係。在矽穀,眾所周知Facebook的首席執行官馬克·紮克伯格(Mark Zuckerberg)親自通過電話和視頻來延攬最受歡迎的研究生。七位數的起薪時有所聞。參加該領域最重要的學術會議的人數增加了近四倍。重要的不僅僅是一個零碎的創新,而是控製一個可能代表全新的計算平台:無處不在的人工智能。

 “人工智能” 這個字眼說起來好像它的含義是不言而喻的,但它一直是混亂和爭議的根源。 想象一下,如果你回到了20世紀70年代,攔住街上的一個人,拿出一部智能手機,對她展示穀歌地圖。 一旦你設法說服她你不是一個著裝奇怪的巫師,從你的口袋裏拿出的不是一個黑巫術的護身符,而隻是一個比擔任阿波羅任務的計算機更強大的小小計算機,對她而言,穀歌地圖似乎當然是一個很有說服力的“人工智能”的例子。在一個非常真實的意義上,它就是。 它可以做任何識地圖的人可以做的事,像讓你從你的酒店到機場 –- 可是它可以做得更快更可靠。 它也可以做人類顯然不能做的事情:在你下錯出口時,它可以評估交通,計劃最好的路線,重新定位自己。

實際上,今天沒有人會給Google地圖尊貴的“AI”稱號,就如我們極少帶感情地使用“智能”這個詞一樣。我們認為人工智能必須是區分HAL(2001太空漂流記中的人工智能機器)和其它任何織機或手推車可以做的。 一旦我們可以自動完成一項任務,我們將涉及的相關技能降級為單純的功能之一。從貶義上說今天穀歌地圖似乎就是機械的:它隻接受一個明確的指令(從一個地方到另一個地方),並盡可能有效地滿足這個指令。 “人工智能”的球門因此不斷退後。

當他有機會時,Pichai仔細區分了目前的A.I. 應用以及“通用人工智能”的終極目標。通用人工智能不會忠實地遵守明確的指令,而是將展示一種具有隱含的,解釋性的功能。它將是一個通用工具,為一般情況下的一般用途而設計。 Pichai認為他的公司的未來取決於此。想象一下,如果你能告訴穀歌地圖,“我想去機場,但我需要停下來,為我的侄子買一個禮物。”一個更通用的智能版本的服務 -- 無處不在的助手,就像斯嘉麗·約翰遜在三年前在斯派克·喬恩的電影“她”中令人難忘地演繹的一樣,- - 會知道好多事情,比如一個親密的朋友或勤懇的實習生所可能知道:你的侄子的年齡,你通常喜歡花多少錢在孩子的禮物,和在哪裏找到一個開門的商店。但一個真正聰明的地圖也可以知道一個親密的朋友不知道的,如你侄子學校的學齡前兒童中最近剛火起來的東西,或更重要的是,什麽是用戶實際想要的。如果一個聰明的機器能夠辨別關於我們過去行為的一些錯綜複雜的數據或含混的規律,它也許能夠推斷我們隨後的欲望,即使我們自己對此也一無所知。

A.I.輔助助理應用的新浪潮-- 蘋果的Siri,Facebook的M,亞馬遜的回聲 - 都是機器學習的產物,具有相似的意圖。 然而,機器學習的企業夢想並沒有被透視消費者的目標所耗盡。 三星的醫學成像子公司今年宣布,其新的超聲設備可以檢測乳腺癌。 管理顧問正在全力以赴給高管們準備自我編程計算機越來越廣的工業應用。 DeepMind是2014年穀歌的一項收購,它擊敗了古老的圍棋遊戲的人類大師,盡管預測說這樣的成就還需要10年。

艾倫圖靈在著名的1950年的論文中提出了一個通用人工智能的測試:一個計算機可以在五分鍾的文本交換的過程中,成功欺騙一個真正的人類對話者。 一旦機器可以在兩種自然語言之間流暢地翻譯,有一天一台機器可能足夠好地 “理解”人類語言並進行可能的對話的根基已經被建立了。 Google Brain的成員,推動和幫助監督翻譯項目,相信這樣一個將成為個人數字助理的通用全智能機器已經上路了。

接下來的是一個穀歌研究人員和工程師團隊如何在這個方向從一兩個人,三四個人,最後超過一百多個人取得了巨大進步的故事。在很多方麵這是一個不尋常的故事,不光是因為它打破了我們已經習慣的許多對矽穀的刻板印象。 它沒有推出任何認為明天或第二天一切都將無法辨認的人物,因為他們是一些在車庫裏異想天開的匠人。 它不是一個關於人們認為技術將解決我們所有的問題的故事,也不是一個關於人們認為技術會不可避免地創造毀滅的故事。 這與破壞無關,至少不是以這個詞常用的意思。

事實上,這是三個重疊的故事,關於Google翻譯的成功變形到A.I. -- 一個技術故事,一個體製故事和一個關於創意演化的故事。技術故事是關於一個公司的一個產品團隊,以及他們隻用了大約四分之一的時間改進,測試和引入一個全新版本改造舊產品的過程,超過任何人,包括他們自己的預期。體製故事是關於該公司內一個小而有影響力的人工智能團體的員工,以及他們的流程中對一些關於計算的舊的,未經證實概念的直覺信念如何顛覆了附近其他公司。創意的故事是關於長期以來一直默默無聞的認知科學家,心理學家和不懈的工程師,以及他們看似不理性的信念最終激發了我們在技術,理論,甚至意識本身的範式轉變。

第一個故事,穀歌翻譯的故事,發生在山景城九個月的時間裏,它解釋了機器翻譯的轉型。 第二個故事是Google Brain及其眾多競爭對手的故事,發生在矽穀五年的時間裏,它解釋了整個社區的轉型。 第三個故事,深度學習的故事,發生在各個遙遠的實驗室裏- - 蘇格蘭,瑞士,日本和加拿大的大部分地區- – 在七十多年時間裏,它極可能幫助修訂了人作為首先和最重要的會思考的存在的自我形象。

這三個都是關於人工智能的故事。 七十年的故事是關於我們可能會想到的或者想要的。 五年的故事是關於它在不久的將來可能做什麽。 這個九個月的故事是關於這一分鍾它可以做什麽。 這三個故事本身隻是概念的證明。 所有這一切隻是開始。

-------------------------------------------

譯後記:

這是年前讀到的關於人工智能最有深度的文章。讀完之後立馬用穀歌翻譯把2700多字序言翻譯出來,連帶修改用了三個小時。不竟對這個新AI版的翻譯器非常歎服!感覺真的是奇點在臨近,從5年到9個月,革命已經發生,不難想見新的學習模式,傳播模式都會隨著降臨。借狄更斯的話,“那是最好的時代,也是最壞的時代;是智慧的時代,也是愚蠢的時代;是信仰的時代,也是懷疑的時代;是光明的季節,也是黑暗的季節;是充滿希望的春天,也是令人絕望的冬天;我們的前途擁有一切,我們的前途一無所有;我們正走向天堂,我們也走向地獄。”

[ 打印 ]
閱讀 ()評論 (2)
評論
tiantianlu02 回複 悄悄話 回複 'weston' 的評論 : good to see you here. I tried it too. The Chinese to English is lackluster to say the least. It could be the data quality issue, a.k.a, less data for Chinese to English. But English it Chinese translation had made leaps and bounds. I was very impressed.
weston 回複 悄悄話 Last paragraph in English, courtesy of Google. The result is iffy at best.
"This is years ago to read about the most in-depth article on artificial intelligence. After reading with a Google translation with more than 2700 words preface translated, associated with the modified three hours. The new AI version of the translator can not help but admire! I feel really singularity is approaching, from 5 to 9 months, the revolution has taken place, it is not difficult to imagine a new learning model, the mode of transmission will come with. In the words of Dickens, "it is the best and the worst of times, the time of wisdom, the time of foolishness, the age of faith, the age of doubt, the season of light, the season of darkness, The spring of hope is the winter of despair; Our future has everything, Our future has nothing; We are going to heaven, We are going to hell."

I've been using the tool regularly, haven't seen the promised leap fwd.
登錄後才可評論.