數論人生

數論是一門學科,也是我的人生。有人把酒論英雄,我用數字描天下。
個人資料
歐洲聯盟 (熱門博主)
  • 博客訪問:
正文

邏輯推理的數字化

(2024-08-06 09:27:57) 下一個

眾所周知,中共的報刊是不能看合訂本的,即使是一周的合訂本都不行,因為它們前後矛盾。前總理朱容基看新聞聯播時都說:聽聽他們又在胡說八道些什麽!我曾經遇到過一個社科係的教師,他評講師時用的論文是《深入批鄧,堅持反擊右傾翻案風》,評副教授時用的論文是《堅持改革開放,迎來科學的春天》;前後不到兩年,完全沒有半點違和感,評委們都驚呼不可思議。對於行為上的自相矛盾,我們可以提醒他要點臉麵;對於睜眼說瞎話者,可以給他看看事實真相;對於思想上的自相矛盾者或腦殘,就要教他一點人類的邏輯推理規則了。

將自然語言邏輯化是人類進步的必經之路,這是讓無法量化或無法建模的東西進入到可計算世界的一種途徑。除此之外,它可以對需要嚴謹的係統提供證明的依據,使得一個係統被證明它是沒有錯誤的。形式化語言也在逐漸興起之中,這種語言可以通過證明讓一些軍用係統或者醫療係統等需要高嚴謹的係統沒有漏洞。

在數學上有一階邏輯、二階邏輯,和模糊邏輯。一階邏輯就是把句子當作原子命題,按照通常的推理規則如逆否命題與原命題等價、三段論推理規則、De Morgan定律等進行邏輯演算。我在大學教《數理邏輯》時就已經把它量化了,寫出了算法,隻是沒有代碼化;現在是時候把它變成計算機程序,用以駁斥“五毛邏輯”了。

尚不足的是,一階邏輯不允許對謂詞進行量化,它需要二階邏輯來支持證明或推理。二階邏輯比一階邏輯更有表達力;它使用不同的變量來區分物體及屬性的量化和集合的量化。集合論是數學的基礎,它可以在一階邏輯的架構內公式化為公理化係統(可能丟掉了完備性)。邏輯推理規則與集合的運算規則是完全一致的;蘊含關係等價於集合的包含關係。然而,作為“哥德爾不完全性定理”的必然結果,二階公式的“可證明性”不可能同時滿足4個想要的特性: (1)兼容性(Consistency)不可能有命題及其否命題同時出現。(2)(可靠性Soundness)每個可證明的二階邏輯句子是普遍有效的(Valid)。(3)(完備性Completeness)每個普遍有效的二階公式是可證明的。(4)(實效性Effectively Axiomization)有一個證明檢驗算法(這第三個條件經常被接納, 不過它沒有被明確的規定)。)

我們可以引入模糊邏輯,給“有效性”一個數值標準:除了“正確”與“錯誤”兩種選項之外,允許一個命題有一定比例的真實度。這個真實度可以表示為“模糊集合”的成員的歸屬函數(Membership function),每個函數映射一個特征變量的值到【0,1】內的一個確定值。結合機器學習的概率模型,我們可以把歸屬函數的表示用一些大數據來訓練,根據過去的經驗來使概率偏差達到最小化。

對於一篇非英文(如中文、日文等)文章,先用Google翻譯成英文,再用Grammarly檢查拚寫錯誤。然後用我的“Logically”進行詞義處理。首先去掉贅詞,提取詞幹。不定代詞{a, an, the}是贅詞,其它任何不感興趣的單詞都可以加入到贅詞集中。機器學習中已經有提取詞根的算法,英文中有大約2000~3000個基本詞根。我列出了每個英文單詞的同義詞、近義詞並且賦予0.5到1之間的一個分數相似度,對反義詞則賦予0到0.5的相似度。

其次,作句子處理。每個句子對應於一個集合{主語集;謂詞集;賓語集} ,陳述句和命令句直接賦值1。否定句轉化為一個句集的補集,將其補集賦值1;如果文章中同時出現一個集合及其補集,則判為自相矛盾,處理結束。對帶有 “可能、也許、問號?” 等詞的句集,賦予一個未知變量,其取值為開區間(0, 1)。

整篇文章就成了句集*賦值的集合,把它看成是所有句子的析取(且), 或者句集的交集。對於一個給定的詞幹,找出包含它的所有句集。如果隻有一個,便不作處理,其 “特征值”定義為0。如果有兩個或更多,則計算它們的賦值之差,再平方相乘,得到此詞幹的 “特征值” 。把所有詞幹的特征值相加,得到一個“可信函數”。求出可信函數的最小值m,定義為此文的 “不可靠性” :如果m很小、接近於0,此文是可信的;如果m的值太大,比入大於0.5,則此文存疑;如果m>1,則此文不可信。

等我把這些算法變成計算機程序後,某些人的文章就要被戳穿了!

[ 打印 ]
閱讀 ()評論 (4)
評論
歐洲聯盟 回複 悄悄話 回複 'dhyang_wxc' 的評論 : 數值計算不會出錯的,除非硬件故障。而且,從諸多備選方案中,我選取概率偏差最小的那個:如果有多個選項達到相同最小值的話,就隻能憑個人經驗作出選擇了。
dhyang_wxc 回複 悄悄話 你的計算機程序算錯的時候,比如說小概率事件上+偶然算錯的時候,你打算怎麼辦?
歐洲聯盟 回複 悄悄話 回複 '西岸-影' 的評論 : 一篇文章總是有限的,這用於反駁某篇文章足夠了。更難的是讓機器做形式運算,這樣世界上就沒有了解不出的數學猜想,或者說不需要人去做了。
西岸-影 回複 悄悄話 所謂邏輯的錯用並不是這種概念,也不在這些方麵。邏輯的數學基礎是集合,從集合角度並不難證明一個邏輯是否成立。
邏輯上的失誤一般是發生在邏輯範疇錯用,最典型的,也是網上常見的,是用辯證邏輯替代形式邏輯。這不僅在網上,在很多國際爭端打嘴仗大外宣上也是常見,比如一般說的雙標就是陷入這個範疇。
因為辯證邏輯客觀上不可能有確定的結果,因此可以任意解釋,所謂話語權就具有優勢。
辯證邏輯對應的是歸納推理,這是中國文化中,尤其是寫文章論述觀點方法上的運作模式,因為結論是開放式的,有利於兼顧所有方麵。
西方文化在邏輯推理上相反,喜歡采取演繹推理的方式。這種方式在心理學角度更具有殺傷力,有利於讓人接受自己的觀點,客觀上也是形成單一的結論,所謂落地有聲,不容置疑,建立話語權。
但形式邏輯基於的推理模式是演繹推理,從集合角度來講很容易看出絕大多數情況下不符合現實,畢竟人們生活中麵對的是一個開放集合,不具備有限性的特點。比如西方文化中不罕見的一個說法就是你如果不能證明沒有上帝,那就證明有上帝。這個邏輯常見於與無神論者的爭論,但從集合角度講,邏輯上是不存在真正的證無的概念的 證無必須經過一個間接的過程,通過證有和存在唯一性的前提而成立。
你這裏的全部內容其實僅僅是局限在有限集合的範疇,使用的也是演繹推理,至於數字化,其實是很簡單的過程,尤其是如果了解邏輯的數學基礎。
登錄後才可評論.