矽穀“編形金剛”:不僅會中文,還是翻譯大師

機器人記者在中國——訪矽新社機器人記者創始團隊
    矽新社是矽穀華人成立的一家側重於科技、財經新聞的中文媒體,顧問團隊包括新華社美國資深記者、《中國日報》資深記者和斯坦福大學訪問學者。矽新社的內容以短新聞、圖片新聞為主,適合移動互聯網時代用戶的閱讀特點。機器人新聞是矽新社的重點項目。
    “歡迎小編機器人@編形金剛 加入我們!希望你能寫出更好更有價值的文章!”3月10日,海外媒體矽穀新聞社的新浪官方微博(@矽新社)上發布了這樣一條信息。隨後,一條條由“編形金剛”自動編寫的“美國融資快訊”被發出。這預示著,矽穀機器人記者“編形金剛“正式登陸中國。
    機器人記者的出現,是時下傳媒界的熱點話題。《中國傳媒科技》雜誌3月刊專門就此予以專題報道,在業學兩界引發了較大反響。本期,記者專訪“編形金剛”的創始團隊,就矽穀機器人記者的能量全麵解讀。
    據介紹,編形金剛由矽新社與矽穀幾位技術大牛合作開發,知識產權歸矽新社所有。矽新社已先後在新浪微博、騰訊微信推出“美國融資快訊”,以及在Twitter上推出英文版融資快訊Funding News,內容均由編形金剛(英文名:NewsWribot)獨立編寫。
    目前,矽新社已經拿到中國著名投資機構的天使投資,正在為A輪投資做準備。而“美國融資快訊”還隻是用來向投資人做展示的雛形,關於編形金剛的潛能和成長計劃,矽新社團隊早有設計,更多極富想象力的產品和應用會在資金和人員到位後,結合需求逐步開發。
    編形金剛的特技:懂中文,會翻譯
    “機器人記者一般會用到的技術涉及數據挖掘、人工智能、機器學習,而編形金剛還運用了機器翻譯技術。”矽新社團隊裏有多名中國成員,包括編形金剛的創始人在內。會寫中文、懂中英文翻譯是編形金剛的特殊技能,這使它目前在美國乃至全世界的“機器人記者圈”都與眾不同。
    “因為我們的數據源是美國的英文數據,編形金剛需要把它翻譯成中文,所以在微博上發布的信息,有的時候語句可能不太通順。我們的技術會逐漸讓翻譯更加流暢、準確。另外,因為微博有140字的限製,編形金剛除了翻譯,還需要掌握話題歸納和提煉的技藝,比如從一篇一千字的文章裏找出20個字……”
    “美國對機器人記者的開發有比較長的時間,這些機器人做的都是英文報道,英文裏麵有一些單數、複數、語法的問題,所以在生成新聞時也有相應的技術在裏麵。我們在Twitter上也發布英文信息,不用翻譯,就比較簡單。”
    編形金剛的語言優勢能夠創造怎樣的價值?矽新社團隊舉例說:“中國有很多科技媒體,他們的消息很多是來自外媒,然後翻譯成稿。所以外媒上有的內容,他們才能翻譯,沒有的內容就翻譯不到。而我們的信息不是來自外媒,而是直接從美國證監會(SEC)的數據庫提取,這種做法在美國來說也是新的。”
    可見,麵對中國市場,編形金剛的潛能和商業價值有非常大的空間。
    編形金剛的潛能:文圖音視四項全能,輿情分析的利器
    除了從文字數據中挖掘信息,機器人挖掘的數據源類型可以更多樣,包括視頻、圖片、聲音、甚至地理位置等等。據介紹,矽新社團隊已和樂視開展合作,正在與樂視體育討論版權許可,獲得授權後,機器人就可以把樂視體育網站上的視頻內容,做成短文的形式發布,免去了人工整理寫作的麻煩。再比如專訪,“假設我們在優酷、土豆上看到一些李開複的采訪視頻,可以用機器人把問題及回答抓取過來,進行濃縮剪輯,就能快遞地自動生成一篇文字專訪稿。”
    而除了“寫稿”,圖像、聲音、視頻采集編輯也是機器人記者即將練就的本領。“比如在某場大會上,我們在會場中的不同位置安裝近景、遠景等五個鏡頭,機器人可以根據聲音來源或人臉識別等自動拍照、錄像,這樣至少可以生成圖片新聞。再比如,在一場足球比賽中,很多體育記者會躲在球門後麵等著抓拍射門鏡頭,這也可以用機器人來代替,或許會比人更加精準地抓拍到精彩畫麵。另外機器人的應用擴展到聲音方麵也是有可能的,以後它會越來越智能化。”
    除此之外,在深度的數據挖掘、多數據源的信息融合方麵,機器人將發揮很大的作用。“比如圖片的分析。我們經常會在報紙上看到某某公眾人物的照片,得知他去了哪些地方、會見了誰等信息。而從信息挖掘的角度可以挖掘到更深層次的信息,比如這位公眾人物在最近六個月中,和誰走得比較近,或者誰消失了,為什麽消失……類似這種非淺層信息,需要從很多的數據源中深度挖掘,這件事由人來做就比較累,而機器人操作起來就比較輕鬆。因為人臉識別,特別是對照片的識別,相對來說是比較容易的,但目前還沒有實際應用案例。”
    在輿情分析上,機器人也可成為一把好手。矽新社團隊告訴記者,美國中央情報局CIA旗下風險投資公司 I-Q-Tel投資了芝加哥的人工智能數據公司Narrative Science,在本·拉登被海豹突擊隊擊斃之後,CIA就通過機器人數據挖掘與分析檢測當地民眾在網上的輿論及情緒,以預測中東某國暴亂的可能性。“在中國也可以用機器人來做輿情及行業情報分析,比如在一些特定人員涉嫌犯罪被抓之前,網絡上已經開始傳播相關信息,機器人就可以抓取、挖掘這些信息加以分析。”
    機器人記者“編形金剛”在中國的“適應力”相當強,完全可以實現對敏感信息、違反法律法規的內容進行篩選和分析。比如目前新浪微博就有這一技術的應用,自動進行敏感詞檢索和屏蔽。
    矽新社團隊還介紹了一個更有意思的應用,即對曆史信息的挖掘。比如,機器人可以從圖片數據庫裏麵,找到在天安門廣場上同一個地點、不同人、不同時期拍攝的100張照片,看在過去的曆史長河中,這個場景是怎麽發生變化的,會像看電影一樣。

機器人記者的局限:
    隻適用於特定的場景
    雖然機器人記者在中國傳媒業還不多見,但在美國,有幾位已經大名鼎鼎了。其中包括美聯社在去年夏天開始和科技公司AI(Automated Insights)合作的Wordsmith財報文章撰寫平台,目前Wordsmith自動生成的文章已經不再需要人工檢查和加工,它撰寫文章的錯誤率比人撰寫的錯誤率更低,而且Wordsmith每季度可以撰寫3000家公司的財報,數量驚人。
    上個月,美聯社宣布將再度與AI合作,用機器人撰寫體育新聞。美聯社今年春季開始,將以機器人撰寫全美大學體育聯盟(NCAA)籃球分組賽事,未來2年逐漸擴大至足球分組。運動比賽和財經新聞類似,報道包含統計數字,球隊賽史與排名、球員曆年表現、比賽結果預測等,都涉及統計分析,機器人執行賽後結論的速度與正確性,高於人類。
    矽新社團隊坦言,“機器人有一定的應用場景限製,並不是每篇文章都可以用機器人來寫。至少目前來看,它主要還隻適用於金融、體育等數據繁多的領域,以及摘錄性的工作。不過,人工智能、機器學習這些前沿科技本身還處在迅速發展的過程中,還沒有很完善,所以機器人記者的未來具有非常大的想象空間。”
    機器人記者的目的:
    最大限度地解放人類
    機器人記者的出現,讓不少人類記者開始憂慮,擔心自己的價值某一天會被機器取代。在矽新社團隊看來,創造機器人記者不是想要取代記者,而是為了減少人的工作,把記者解放出來去做更有創造性的事情。工作量巨大或突發性的緊急報道,是機器人的特長,而深度分析的文章,目前就是機器人做不了的。
    去年3月,美國加州發生了一次4.4級地震,《洛杉磯時報》是最快通過網站報道該消息的媒體,這篇稿件就出自機器人之手。機器人第一時間從美國地質勘探局的係統中抓取地震的相關數據,從寫作到發布隻用了三分鍾時間。“像這樣一條資訊,記者也能寫得出來,但是深更半夜的,讓記者快速反應,采訪、寫作、報道,確實挺費力氣。”
    除了解放人類,機器人記者的出現還有一個原因。“美國的人工太貴。為什麽美聯合、洛杉磯時報會采用機器人記者?因為人工如此昂貴,再讓他們去寫很枯燥的、機械性的、結構性的報道,就是資源浪費。”這確實是一個很實際的考慮。
    如此看來,機器人記者的出現無疑會對傳媒業的發展起到推動作用,對於傳媒人來說,是解放而不是替換,它促使記者發揮更強大的創造力,寫出更敏銳、更有趣的新聞報道,而不是將精力放在最初的數字上。(記者 劉勝男)
 
請您先登陸,再發跟帖!