事實上,從Turing Test,到AlphaGo Zero的測試,到無人汽車的測試方法,都是錯誤的。交通部趙小蘭前部長該思考這些問題。
前麵說過語言模型需要拓撲、流形、希爾伯特空間所不具有的特征。原來主帖是說從自然語言到數學的“編譯器”根本不可能存在。這是數學的缺陷。
想用驢頭不對馬嘴的環境來淹沒正確觀點,導致科學走錯方向是自欺欺人。
借這地方。向趙小蘭前部長建議,辦一個麵向公眾的、較認真的研究性論壇,廣開言路。如果全民亂講,很容易奸佞當道。這樣下去,路越走越窄,就麻煩了。
大陸法係和海洋法係在太空時代的演變,更加重要。把bee等同法律中的fish處理,會有什麽邏輯影響和教育影響,會不會鼓勵指鹿為馬的那些人?下麵這個帖原來被子女論壇刪掉。現在我在這裏貼一下。
---------------------------------
加州某法院的裁決把bee等同法律中的fish處理。爭議涉及魚的定義 [注]。本地物種保護本來就很有爭議。為什麽不修法?
太空時代什麽該受保護,什麽該被消滅,爭議更大。而入侵私人計算機、監控和幹擾私人空間活動,又該如何處理?
大陸法係和海洋法係差異很大。未來的法律體係會如何演變,就留給法學專業的人思考。
人類合作需要共同基礎。曾經有很多人認為全球化經濟可以是人類合作的基礎。但現在出現全球性生產過剩,紅海競爭在加劇惡化。一係列的經濟案件提醒人們經濟需要受法律製約,而各國的法律體係是不同的。
倫理可不可以成為超越法律的共同基礎?儒家的理想是倫理社會。但很多國家自認為是法製國家。況且不同宗教派別的倫理千差萬別。
而人類麵對的自然規律是相同的。所以邏輯和科學可以成為很好的合作基礎。問題是哥德爾不完備定理意味著人類不得不使用多個世界模型,這會產生很多邏輯問題。未來的太空探索也會遭遇越來越多的邏輯、法律和科學問題。科學邏輯需要怎樣的結構和機製去處理inconsistent和incomplete?
現在很多重要的學術問題無人去討論。到底問題出在哪裏,是誰有邏輯問題?人工智能專業裏是不是有人在強詞奪理?
智力新科學的建立需要糾正一些學術錯誤。不糾正,詭辯就會流行,導致蒙昧和文明衰退。這些實際上正在發生。
現在的國際政治危機結束後,智力新科學的基礎研究、國際太空法及大陸法係、海洋法係的問題就會變得重要起來。這才是美國真正的挑戰。
[注] (Reuters) - Bumblebees are eligible for protection as endangered or threatened “fish” under California law, a state appeals court held in a win for environmental groups and the state’s Fish and Game Commission.
The Sacramento-based California Court of Appeal reversed a lower court’s ruling Tuesday for seven agricultural groups who argued that the California Endangered Species Act (CESA) expressly protects only “birds, mammals, fish, amphibians, reptiles, and plants” – not insects.
While “fish” is “commonly understood to refer to aquatic species, the term of art employed by the Legislature … is not so limited,” Associate Justice Ronald Robie wrote for the appeals court.
CESA itself does not define “fish,” but the law is part of the California Fish and Game Code. The code’s definition includes any “mollusk, crustacean, invertebrate (or) amphibian,” Robie wrote. All those categories “encompass terrestrial and aquatic species,” and the state legislature has already approved the listing of at least one land-based mollusk, the opinion said.
“Accordingly, a terrestrial invertebrate, like each of the four bumblebee species, may be listed as an endangered or threatened species,” Robie wrote, joined by Acting Presiding Justice Cole Blease and Associate Justice Andrea Lynn Hoch.
----------------------------------------------------
這不是數學話題:人工智能測試不是QA,黃士傑和黃仁勳兩位先生應注意。二十餘年前的Avant!案對人工智能生成代碼也是警示。
現在Nvidia股票大漲,以後對人工智能測試的需求也大大增加。
人工智能測試和認證需要理解科學邏輯以及智力的結構、機製原理,需要理解智力的模式演變高度不穩定性,才能設計有效檢驗人工智能技術的實驗。
符合這個資格的需要理解Turing Test的本質錯誤,應該是受過智力新科學係統教育的新型學者。這跟基於簡單邏輯的傳統計算機程序和QA完全不同。
七年前我就警告過計算機圍棋仍有問題。最近有業餘棋手可穩定戰勝高水準計算機圍棋。這說明以前的
無人汽車問題更嚴重,SAE level 4不可能實現。需要新的、能夠有效檢測的自動駕駛標準。現在無人汽車的測試結果靠公司自己提供,不規範、不準確、不科學。曾任交通部長的趙小蘭女士應該知道。
另外,二十餘年前的Avant!案對人工智能生成代碼也是警示。其實高科技業界把別人的代碼拿來修改成自己的程序,很普遍。當年Avant!被發現,純屬偶然,被抓住的隻是少數倒黴蛋。這就是為什麽現在這麽多業界精英熱衷於人工智能生成代碼。
不過人工智能在自然語言理解上有嚴重智力缺陷,對複雜一點的問題,就不能找到合適代碼。能準確生成的代碼更少,水平也很低。
業界人士應該知道,對有結構問題的複雜程序,常常修改太麻煩,還不如寫新的。人工智能的結構理解,很成問題。
作為對照,Linux的內核可以由少數人寫,而Google Mobile Services是閉源的。
IT業除了計算機專業的編譯器和操作係統,電子專業的芯片製造設備、芯片製造、EDA這幾個更重要。2015年智能手機市場達到頂峰,然後萎縮。2018年華為開始受打擊,跟操作係統相關的Google Mobile Services、EDA、芯片製造、芯片製造設備都是打擊範圍。
EDA是把基於簡單邏輯的設計轉化成電路和芯片實現方案。計算機語言編譯器是把基於簡單邏輯的高級語言程序轉化成低級語言程序。而人類智力和人工智能涉及複雜邏輯,所以人工智能從高層人類思想生成代碼,其基本原理跟編譯器和EDA都不一樣,有嚴重缺陷和本質問題。
黃仁勳先生對人工智能泡沫化應有特別警惕,高處不勝寒。智能時代未來教育倒是很大的機會,但需要長期積累的科學邏輯和智力結構、機製的基礎理論研究和針對人工智能新技術的實驗設計和檢驗,靠創業和快速試錯不行。
黃先生現在也是矽穀華人的驕傲和最有影響力的人。有一大批人會出於權勢和利益圍著他轉。這也意味著責任。既有對未來科技和經濟走向的責任,也有對社會公正的責任。
以前想創業時,有人要我用開源平台,說否則就要訴我。我根本沒決定用什麽平台,也沒告訴別人我打算implement什麽功能。毫無依據就說要訴我,是脅迫,是play evil。還有人說要破壞我的計算機,對我“溫水煮青蛙”。這是慢性死亡威脅了。他口頭上編些驢頭不對馬嘴的理由,其實也是脅迫,是play evil。
探索智力新科學,不是浮士德跟魔鬼作交易,需要平等討論、公正實驗。全民亂講、play evil會把自由、民主玩死。古雅典是前車之鑒。
我反對把我帖放在數學子壇。斷章取義、屏蔽我的一些重要分析更可笑。用小動作來轉移對學術討論的關注太無聊。我不想多說,把主帖換成這內容遠離數學子壇。原帖在下麵:
---------------------------------------
AI語言模型的關鍵是做一個自然語言到數學的“編譯器”,然後數學到計算機語言。
但根據我的智力科學理論,這是不可能的。這可以設計規範實驗驗證。這兩部分都有問題,AI自動生成回到自然語言更不對。這裏的“編譯器”隻是概念上的類比,既不是真的編譯器,也不可能存在,所以加上引號。下麵有人提起操作係統,隻好解釋一下。
這跟計算機語言編譯器可截然不同。計算機語言編譯器是形式語言到形式語言,用簡單邏輯就可以。
自然語言涉及複雜語義、複雜邏輯,跟形式語言完全不同。所以研究語言模型問題,不但需要研究自然語言,還要研究語言模型的數學基礎Universal Approximation Theorem和word-embedding vector space有什麽問題,需要什麽結構和機製有拓撲、流形、希爾伯特空間所不具有的複雜性?
科學革命、科學邏輯、科學實驗方法超出了數學思維的範圍。所以,很多習慣數學思維的人,無法理解現在的人工智能測試理論和方法有嚴重缺陷。
而很多人覺得數學學得太深很枯燥乏味。連楊振寧教授都說:“The language of modern mathematics is too cold and abstract for a physicist“。不過如果有實際問題去研究相關數學問題,又另當別論。因為實際問題會提供直覺,沒有那種枯燥感。
人工智能和語言模型的挑戰,也打破了文理分科的傳統教育。以後別再文科生、理科生的,那種概念過時了。
有報道說語言模型在挑戰醫學考試中進展很快。光靠刻苦努力、死記硬背學醫的,以後會有麻煩。但醫學智力跟數學智力也是很不一樣的。學數學出身的,去華爾街轉行容易,轉行醫生不容易吧。
不過科學邏輯和智力科學研究不能急功近利、急切下結論,快速試錯無法得到正確結論。而要長期積累,審慎、仔細地選擇語言、語義,構建嚴謹邏輯。年輕聰慧的學生,腦子轉得太快,不一定做得了。
陶哲軒教授能不能找出語言模型的問題,能不能找出自然語言和數學的本質區別?
GRE考試有對語言和語義的精確分析,但遠遠不夠。其邏輯部分考試尤其缺乏科學深度,缺乏對科學邏輯和科學革命的理解。這在人類麵臨人工智能技術挑戰時,變得很關鍵。
我非常樂見人工智能和語言模型去挑戰GRE考試,以此提醒通識教育和GRE考試需要改進,以適應未來智能時代的需要。人工智能也需要準備麵臨人類的改進和反擊。
別人皮裏陽秋逗趣,我一般不去打擾。我認真談些學術,別人也不要當作眼中釘。況且現在已是危機深重的時候,全球性生產過剩,惡性競爭加劇,計算機和智能手機市場萎縮。