Nature報道ChatGPT打破圖靈測試,並把尋找評估人工智能新方法當作競賽新焦點,就反映了這樣的趨勢。
ChatGPT問題很多很明顯,這隻能進一步證明圖靈測試無效。AlphaGo Zero的superhuman performance也不對。但Deepmind早就宣布AlphaGo Zero退休,沒法用新方法評估。是Deepmind理虧。
Google的Driverless car項目和Waymo的無人汽車涉及公共安全,但隻由公司自己測試、自己申報。這樣的程序當然有問題。要考慮到人類智力的模式演變高度不穩定,與人類智力互動和競爭的無人汽車在大規模部署較長時間後,其特性和缺陷會被普通人了解而產生新問題,包括嚴重的問題。
工程技術更新很快。我剛來美國時就聽說計算機技術方麵的教材兩、三年就不得不更新。否則很快會落伍。
所以現在的人工智能教材,特別是測試方法,成了大問題。
這些正是科學邏輯研究和教育的主要目的,包括正確設計和分析規範科學實驗和測試人工智能技術。
再提醒一下,生命科學的盲法試驗,包括雙盲試驗,實際上基於一些心理學概念。這跟圖靈測試用屏蔽測試者和被測試的人和人工智能的方法是在同一層次。
按照我的智力科學理論,生物學、生理醫學、心理學都是動物生理層次的,無法正確測試、分析人類特有智力。物理科學、生命科學、智力科學也需要不同的參照係,不能停留在廣義相對論的參照係理論上。
科學教育需要從不同的角度不斷重複基本原理,以加深理解。這比小說、電影要枯燥一些。但對基本原理熟悉、透徹後,才能有更進一步的認識。
有人用詩描述治學三境界:“獨上高樓,望盡天涯路”是第一境。“衣帶漸寬終不悔,為伊消得人憔悴”是第二境。“眾裏尋他千百度,驀然回首,那人卻在,燈火闌珊處”是第三境。
評估人工智能不會像開發人工智能那樣對公眾造成威脅,所以是安全、和平的基礎研究。
當然基礎科學掙錢不多,但能引領未來趨勢的智力科學基礎研究新方向,說不定會在學生一輩中催生出未來的科技領袖。也會對教育、司法、人類在太空中的基因和智力演變產生很大影響。