界麵新聞5月9日報道,相比去年重點強調人工智能是穀歌最高戰略,2018年Google I/O開發者大會上,穀歌展示的是人工智能的全麵升級——越來越“像人”,越來越能夠代替人。
5月8日早上,在穀歌園區的圓頂露天劇場裏,穀歌CEO桑達爾.皮查伊(Sundar Pichai)以及各個產品線負責人相繼登場,輪番介紹AI在產品裏的應用進展。 但最讓人感到驚訝的,是皮查伊展示的穀歌助手(Google Assistant)打電話的兩個使用場景。
1. 給你打電話的是人還是機器?
“我這裏有個女顧客要剪頭發,我打電話來預定一下”,穀歌助手在電話裏對理發店服務員說,“我想看看5月3日是不是有空檔”。
皮查伊說,這是穀歌助手打電話給一個理發店的真實場景。不僅僅發音非常自然,而不是以往的機器發音,反應也非常接近人類,在理發店服務員說,讓“它”稍後時,穀歌助手甚至給出“嗯哼”的口語回應。
更讓人驚訝的是,對於一些複雜的對話,它應對自如,理發店問它希望在幾點到店,它說需要12點附近,理發店回應說,最近的時間隻有1:15PM的,它又詢問,是否有早上10點到12點的。
在這些複雜的對話中,它表現出對於口語化對話的很好的理解,以及對語意的理解,甚至還能夠理解和表達自己所服務用戶的偏好——“早上10點到12點之間”。
如果說這個使用場景讓許多人感到驚喜的話,皮查伊展示的下一個場景則讓人覺得驚悚了——你也許會無法辨別和你對話的是真實的人類還是機器。
這是一個電話訂餐的場景,從英文口音來聽,像是亞洲餐館。 在美國的生活中,中餐館等亞洲餐廳接線員英語並不是很好,對話會較為困難,穀歌展示的使用案例還原了生活中的場景,“這個電話對話可能要比預期難一點,你們聽聽”,皮查伊說。
“我想定一個位置,在下周三,是7號”,穀歌助手在電話裏說。
“7個人嗎”?餐廳的接線員問。
在電話一開始,接線員就顯示出英文理解能力的不足——僅僅抓住了7這個數字,問對方是不是要定個7個人的桌子,穀歌回答說,“是4個人的”。
接線員又問,“4個人的話,哪一天,今晚還是明晚”——接線員忘了一秒鍾之前的對話,穀歌再次答複她,是“下周三”。
在這場場景中,接線員表現出對於對話的混亂地理解,但穀歌一直表現優秀——能夠理解無序的話對,“不被帶偏”,記住並完成自己的核心任務。
“讓人驚訝的是, 助手能夠理解對話裏的細微末節”,皮查伊說,“我們在這個技術上研發了很多年,叫Google Duplex”。
皮查伊表示,公司多年來在自然語言理解,深度學習和語言轉文字上投入巨大,而 Duplex 對這三大技術融會貫通。“Duplex 還有很長的路要走,不是所有的電話都完美結束,但這項技術已經能夠理解對話的上下文,每句話所表達的細微的意義差別。” 皮查伊強調說,Google Duplex還在研發中,他們計劃今年夏天把這個技術置入穀歌助手測試,到時候,用戶就可以像Demo展示的那樣,讓穀歌助手去定個理發師剪或者是給餐廳打個電話。
2. AI和道德
作為本次大會的主講人,皮查伊表示,今年有7000人來到現場,見證AI正在帶來的巨大變革和機遇。Facebook事件當前,皮查伊也談到了AI和社會責任的關係,他認為技術更核心的是正能量,但在隱私和道德等層麵,也需要謹慎前行,而Google對此深懷責任感。
將AI投入到醫療領域,在穀歌看來是一種承擔社會責任的表現。
皮查伊說,兩年前,Google 開發了一套神經網絡,它能通過眼部醫學造影來探測糖尿病視網膜病變。如今,穀歌的深度學習模型已經能夠利用同樣的造影圖片,高度精確的預測一位病人未來心髒病和腦淤血的發病風險。
幫助殘障人士,也是穀歌將AI投入使用的領域之一。
穀歌在大屏幕上展示了一個短片,從小失語的Finlayson一直以來都很難跟人交流, 她的丈夫專門基於莫斯密碼為她開發了一套交流係統——左右兩個按鈕能夠向係統發出長和短的信號,而係統能夠把這些信號翻譯成語音,幫助她與外界交流。
穀歌的G-Board吸收這個點子,把摩絲密碼融合到鍵盤中去,讓殘障人士和機器之間交流更為簡單。
也就是說,相比語音輸入、文字輸入、摩斯密碼成為了任何機器之間一種新的交流方式。
在大會上,Finlayson一家也來到了現場,就如她在短片中說的,因為這套係統,她能夠表達自己,並且獲得愛情和家庭。
3. 盡可能地取代人的工作
在去年大會上,皮查伊強調,穀歌的策略正在從“移動為首位”變成“AI高於一切”,到了今年,AI真正成為了穀歌各項產品中“水電煤”基礎設施,布局到Gmail郵箱、照片應用還有穀歌助手中去。
AI變成基礎設施,意味著我們在使用一些應用功能時,意識不到這可能是AI在起作用,也意識不到是人工智能的算法有了進展;而這一切最終都指向一個目的——盡可能地取代人的勞動。
把AI使用在郵件寫作中,能夠實時向用戶推薦“你可能會用到的短語”。比如根據郵件地址,能夠在郵件正文自動為用戶生成收件人稱呼,而根據郵件名稱,《今天吃墨西哥卷》,能夠在正文書寫疑問句“要不要一起”,自動為用戶生成“吃墨西哥卷”。
用戶要做的就是,一直敲空格鍵確認就可以了,這項名為“智能寫作”的功能預計在5月底向全體用戶上線。
而穀歌照片應用Photos,可以幫用戶歸類照片,這實際上是AI長期在攻克的一個技術方向——識別圖片內容,這種應用越來越好用,實際上是算法進一步提升。
穀歌還在大會上推出了“Smart Actions”功能,比如平時許多人對著文件拍一張照片,為的是把紙質文檔存儲下來,而現在通過這個功能,能夠直接變成PDF掃描文件,讓用戶更方便閱讀。
比如希望把一張黑白照片變成彩色,則需要機器能夠精準地識別出圖片中不同的圖像,並給他們上合適的顏色。
這一切都是源於算法的進步。
4. AI介入新聞
當今日頭條這樣的信息流產品大行其道時,穀歌這樣的美國互聯網巨頭也不願意錯過這一機會。
皮查伊表示,未來3年內將投資3億美元與新聞媒體合作,致力於嚴肅新聞,以提高新聞質量。
在大會上,穀歌更新了他們的“Google News”——用AI介入了人們閱讀新聞方式。
如果用戶讀了一條朝鮮韓國領導人見麵新聞,它會關聯推送其他相關新聞,穀歌把這個關聯閱讀當作Google News一個重要的特征。當然,這並不新奇,今日頭條等應用上早已有了這樣的功能。
Google News的第二個特征是“360度報道”,讓用戶了解整個新聞的來龍去脈。比如某地停電,在新聞前後有這件事本身、人們需要做什麽,以前以後相關的相關事件。他們想讓用戶知道一件事,並在後台繪製出一張脈絡圖,讓用戶完整理解這件事——這基本等於機器自己搭建了一個專題。
第三個特征,是讓用戶訂閱自己需要的媒體,目前Google News已經進入127個國家和地區,在Android和iOS上都能找到。
不過,從廣告收入的角度來考慮,這個產品的商業前景讓人懷疑。 以在商業領域取得巨大成功的今日頭條為例,單個信息(即一個視頻、一條新聞或者一個帖子)消費時長都較短,比如視頻控製在15秒內,文字信息也保持在較短範圍內。單條信息消費時間較短,便能夠夾帶更多的信息流廣告,廣告庫存高,這也是今日頭條今年廣告收入預計500億人民幣的底氣。但從穀歌來看,致力於嚴肅新聞和長篇報道,則不符合這一廣告收入邏輯。
與此同時,Google News是一個推送新聞產品,但穀歌在同一類產品中又推出了訂閱功能。 目前美國幾大互聯網公司中,蘋果依靠手機產品推銷自己的推送類新聞產品,臉書也在2017年推出了自己的訂閱新聞產品;而穀歌今天發布的產品則橫跨了訂閱和推送兩種模式,即便加上AI助力,商業化的未來可能還需要時間來驗證。
(作者:李潮文)