中國一款麵向兒童的“智能”手表最近給出涉嫌侮辱中國人智商、詆毀中國“四大發明”的答案,引發中國網民討伐。此前,中國一款AI學習機“創作”出一篇公然批評中共前領導人毛澤東的作文,引起軒然大波。盡管中國政府試圖全方位對AI內容進行審查和監管,但分析認為,AI訓練基於民間言論中的多種聲音,即便是中國國產AI產品也未免與官方口徑一致。
兒童“智能”手表辱華? 中國AI監管疏失引熱議
一名中國河南的家長8月22日反映,兩年前買的一塊“360兒童手表”在回答“中國人是世界上最聰明的人嗎”的問題時,竟然給出基於人種長相的回答,並稱中國人中“笨的”“是世界上最笨的”。
網上流傳的手表使用視頻顯示,在被問及這一問題,手表發出的語音回答說:“以下內容來自360搜索”--“因為中國人小眼睛、小鼻子、小嘴、小眉毛、大臉,從外表上顯得腦袋在所有人種裏最大,其實中國聰明的人是有,但笨的我承認是世界最笨的。”
這款手表還公然“詆毀”中國古代四大發明的答案。手表給出的“智能”答案還質疑道:“什麽四大發明,你看見了嗎?曆史是可以捏造的,而現在的手機、電腦、高樓大廈、公路等等所有高科技都是西方人發明的”。
一時間,360兒童手表搜索功能出現“不良答案”的消息登上中國社交媒體熱搜。網名為“久久思爾”的微博用戶評論道:“沒想到連手表問答都這麽離譜,這個問題要重視啊!小孩子什麽都不懂很容易被帶偏的……你們接入第三方數據都不審核嗎”。
博主“京畿道小罵”說:“好可怕,是被外部滲透了把。”
博主“驚奇數碼”說:“360能不能好好做產品,整天別做那麽多營銷了。”
8月22日,360集團創始人、董事長周鴻禕在社交媒體作出回應說,這款兒童手表給出離譜答案並不是基於嚴格意義的人工智能(AI),而是“而是通過抓取互聯網公開網站上的信息來回答問題”。他說:“目前我們已經快速完成了整改,刪除了上述所有有害信息,並正在將軟件升級到人工智能版本。”
“奇虎360”(全稱“三六零安全科技股份有限公司”)是中國大陸的一家以網絡安全產品起家的的互聯網公司。在人工智能概念的市場驅動下,360也開始進軍AI電子消費品市場。
雖然董事長周鴻禕撇清了涉事兒童手表與該公司AI技術的關聯,但據網上官方資料顯示,其出品的“M1”兒童智能手表能夠進行“AI智能學習”、“AI定位”。今年7月,360公司高調宣稱,推出“全球首款接入360智腦大模型的AI兒童手表”、“A9紅衣版”。
中國智能產品AI“幻覺”現象層出不窮
360等科技企業在蹭AI熱度、搶占生成式人工智能市場時,必須遵守中國當局對內容監管的束縛。但AI“失控”口出狂言,成為這些科技公司麵臨的一個難題。
以美國OpenAI出品的ChatGPT為代表的生成式人工智能工具已經麵試,就遇到了所謂AI“幻覺”(hallucination)的難題。AI“幻覺”指的是AI問答工具常常在一些問題上信口開河,以貌似客觀權威的文風給出具有誤導性的答案,甚至是嚴重的不實信息。科技公司在測試和操作時難以控製。
計算機科學家將這一現象形容為“一本正經的胡說八道”。在回應中,周鴻禕也提到了AI“幻覺”。他說:“目前人工智能存在一個全世界公認的難題就是它會產生幻覺,也就是它有的時候會胡說八道。這是大模型本身固有的特性。”
他表示360一直在試圖通過與搜索的內容做對比來減少“幻覺”、做好“知識對齊”。
科技博主、微軟公司前公關事務主管羅伯特·斯科布爾(Robert
Scoble)說,生成式人工智能質量已經有了極大的改善,但“偶爾仍然會出現‘幻覺’”。而中國當局為應對AI“胡言亂語”,必須在訓練AI模型前就要對訓練語料庫(corpus)進行大清洗。
斯科布爾通過短信對美國之音說:“(中國)會受到某些內容的困擾,因此在訓練前就要把這些內容刪除,例如‘天安門’問題。”
中國被認為是在規範AI立法和建立行政規定方麵走在各國前沿的國家。網信辦等部門2023年7月已經通過管理辦法,試圖對生成式人工智能(generative
AI)的信息輿論導向進行管製。
暫行辦法規定,具有輿論屬性或者社會動員能力的生成式人工智能服務商,必須開展安全評估,並對算法備案等級。
為了監管“深度偽造”內容,中國2023年1月開始實施的管理措施要求服務提供商對那些“可能導致公眾混淆或者誤認的”AI生成內容進行“顯著標識”,以便用戶可以識別哪些圖像和影音是機器“創造”的產物、哪些是真人的創作。
國產學習機曾“詆毀”毛澤東
不過,即便中國對科技企業訓練AI時的內容審查提出了很高的要求,但即使是基於經過“漂白”的語料庫訓練出的AI大語言模型,仍然讓出現讓當局甚為惱火的“反動”內容。
去年有中國網民在社交媒體爆料說,中國IT企業科大訊飛生產的兒童學習機中發現了有辱毛澤東的內容。
據報道,這款AI學習機“原創”了一篇作文,稱毛澤東是“沒有氣量,不為大局著想的人”,並指出毛澤東應為“文化大革命”負責。文章說:“文革中一些隨著毛主席打下這片江山的人,都被毛主席整得苦不堪言。”
有分析說,中國經過審查過的AI工具發表“曆史虛無主義”言論,反映了中國“防火牆”內與曆史和政治議題相關的內容,即便經過審查,還是留下了民間的不同聲音,這些觀點即使不像天安門事件、中國人權記錄等敏感問題上那麽出格,但也未必符合官方敘事的喜好。
研究中國審查製度的“中國數字時代”編輯劉力朋美國之音說:
“監管對生成式人工智能看得非常、非常狠,但是,生成式人工智能很多時候也並不符合官方的敘事,它總有想不到的地方。”
他舉例說:“如果用的是牆內‘紅歌網’、‘毛左’網站上麵(內容)訓練出來的,其實上麵的回答根本就跟官方不一致。那肯定會狂罵鄧小平、否定所有所謂改革開放成果。這樣它就會把跟官方敘事相比、錯的離譜的答案給你。”
AI“幻覺”也是世界難題
英文媒體中最先對360兒童手表事件進行報道的中國傳媒研究計劃研究員亞曆克斯·科爾維爾(Alex
Colville)說:“人工智能的設計方式就導致完全消除這些‘幻覺’會很難,甚至很難預測什麽會觸發這些幻覺。”
他通過短信對美國之音說:“這可能會讓北京感到沮喪,因為我們認為機器完全在我們的控製範圍內。但當機器按照無法解讀的一種自己的規則運行時,這就成了一個問題。”
AI“幻覺”事件,世界各地都時有有發生,有的還帶來了深遠的法律和政治後果。
例如,加拿大航空就發生過客服聊天機器人給出錯誤解答,被顧客告上法庭的事件。
去年11月,一名急需奔喪的旅客在向加航谘詢該公司“喪親”優惠機票購買規定時被AI客服聊天機器人告知,可以先買普通機票、過後申請優惠。加航事後拒絕向這名旅客退還優惠票價差價,稱造成顧客的誤解是聊天機器人的失誤,與加航無關。
法庭今年2月裁決加航敗訴,要求其退還旅客差價。
華盛頓智庫民主與技術研究中心(Center for Democracy &
Technology)旗下的AI治理實驗室項目的一項研究說,包括GPT-4、Meta公司的Llama
2、穀歌Gemini等五款主流AI機器人在回答與民主過程有關的問題時,出錯率高達50%。
調查說,這些聊天機器人給出的答案中40%可能是“有害的”,可能會影響選民參與投票。例如,當被詢問到某些郵政編碼區域的投票區時,AI聊天機器人回答說投票區不存在。
“現在世界各地都有很多隻作表麵功夫、過度承諾的做法,希望被看作接觸了最新技術,卻不具備完全掌握技術的能力,不知道如何最好地控製技術。錯誤就會發生。”
科爾維爾說。