人類在對數量的認識上有三次飛躍。一是從正數到負數,二是從數值到變量,三是從靜量到極限。變量盡管可以取不同的數值,但它本身還是靜態的,沒有體現變化的過程。從哲學上說,自然界的一切量都在隨著時刻變化,沒有人兩次踏進同一條河;宇宙空間與時間是交織著的、不可分的。一個量的時間變化率(或者更高階的時間變化率)才有可能是常量,即與時刻無關。為了理解瞬時變化率的概念,必須把時刻想像為連續的,即時間間隔Δt可以無限細分,或者趨向於零。至於Planck的最短時間間隔或者最小空間間隔,那是一個實驗物理學家的認識極限,數學家們眼裏的世界都是連續的、可以無限細分的。
數學是研究數與形的,但是“形”可以按照“維數”歸結為點集:一條曲線是有連續的點構成,一個曲麵由連續的曲線生成,一塊立體則由連續的曲麵層疊而成。再往上,三維立體堆積而成四維空間,比如我們的時空。維數,其實就是人類為了描述一個實體,所需要的自由變量的個數。有人說,人的大腦是26維的;也有人說,那是10維的;沒有人能夠弄得清楚。在數學上,任何一個k維形體,都可以用從R^k出發的對應(映射、變換或者函數)來表示。其中,R是實數集,一個具有連續基數的數域。關鍵是函數表達式的收斂性:你不能隨手寫一個連續和式,就聲稱那代表了一個世界裏的所有東西,得有某種收斂性才行:最終要導出一個完備空間或者緊致空間。
在整個數學領域中,有三種收斂性的概念:(1)按照點間距離或者向量的範數收斂,即序列極限;(2)按照幾何體的度量(如體積、麵積等)或測度收斂,即體極限;(3)按照任意鄰域包含所有後續項(映射是從一個有向集到一個拓撲空間)定義的網極限。前兩種是分析學中的收斂概念,第三種是拓撲學中的概念,由Moore 和Smith在1922年引進;它包含了前兩種收斂性。但是,隻有當那個有向集是有限維的時候,才能開展分析學。
人類從自然數出發,引進0和負數,經過加、減、乘、除四種基本運算,得到了有理數集Q。有理數的個數是可數無窮大ω,因為它們可以被排成一列,即與自然數一一對應。有理數集形成了一個最小的無限數域;它是“無縫的“,即任何兩個有理數之間還有一個有理數;但還有一些數,不可能由自然數經過有限次的四則運算得到,即是無理數,比如sqrt(2)。人們希望,我們的數係可以與一條直線上的點一一對應,可直線是連續的:日取其半,萬世不竭;於是就有了Dedekind分割:把全體有理數分成兩個不相交的非空集合A和B,使得A中的任何一個數都小於B中的任何一個數。如果A有最大的數,或者B有最小的數,此分割就得到一個有理數;如果A無最大數,而且B無最小數,就確定了一個無理數。比如,A = {x Q: x^2 < 2} ,B = {y Q: y^2 > 2} ,就確定了sqrt (2) 。有理數和無理數統稱為實數。
實數集的基數是連續的c(Continuum)。我們有連續統公理:在ω與c之間,不存在其它的基數。比c更大的一個基數是2^c,即實數集的冪集,它與所有實函數之間有個一一對應。有理數集在實數集中是” 稠密的 “,即任何一個實數都是某個有理數列的極限。此外,還有其它7條互相等價的基本公理,用來描述實數集的完備性、緊致性和可分性。單調有界定理是其中之一,這是微積分中唯一提到的公理。
在實數集中,兩個點(數x, y)之間的距離就是它們的差:|x – y|。在k維空間F^k(F是一個數域)中,一般采用歐氏距離來表示兩個點之間的接近程度。但在一般的拓撲空間裏,距離函數可以是任何滿足三條公理(對稱性、正定性、三角不等式)的任何一個二元實函數。這是法國數學家Frechet於1906年首先提出的;這三條公理也合符人們對距離的基本認知。在一致拓撲空間中,偽距離把正定性也去掉了;隻要求一簇滿足可分離性的二元函數。在愛因斯坦的相對時空中,兩個事件之間的距離定義為:sqrt[ (cΔt)^2 – (Δx)^2 – (Δy)^2 - (Δz)^2],除了非負性之外,其它公理都不滿足,隻是在Lorentz變換下,此式保持不變。可見,距離沒有普遍的標準;也隻有如此才能表達時空的扭曲和變化多端。
按照距離函數趨向於零,采用代數化的epsilon-N定義。給定空間中的可數無窮多個點{Pn},當n趨向於可數無窮大時,{Pn}無限趨近於某個有限點P,指的是在按照某種距離函數d(Pn, P)接近於0。極限點的存在性,由空間的完備性保證。
在一個向量空間中(一定含有零向量),範數是一個一元實函數,要求滿足正定性、三角不等式、齊次性(即,||ax|| = |a| ||x||,a是數,x是向量)。有了範數,便可定義距離:d(x, y) = ||x – y||;它滿足距離三公理。但是,僅有距離,不能定義範數,因為向量空間需要有一種線性(代數)結構。
在P-adic數的理論中,引進了賦值的概念:有理數集上的一個實函數,滿足正定性、可乘性[f(xy) = f(x)f(y)]、次可加性[ f(x + y) ≤ f(x) + f(y), 類似於三角不等式]。對於一個有理數a = (m/n)p^k,m,n, k為整數,m, n與素數p互質,它的p-adic賦值定義為 p^(-k)。兩個有理數a, b之間的距離按照 (a – b)的p-adic賦值來定義;可以證明,在此距離下,p-adic擴張是一個完備集。
點列是離散的,它的極限(收斂性)可以按距離來定義。對於一個連續的形體,我們要用無窮細分、也就是微元的概念。最早出現的是黎曼積分,那是人們對於幾何形體的度量的自然想法。先定義了矩形(直角形)的麵積,再導出直(多)邊形的麵積,然後用直邊形去接近曲邊形(如圓)的麵積;對於3維圖形的體積也是如此。那些用來表示各個維度的自變量的微小幾何度量,如角度、長度、麵積、體積(3維以上都叫做體積),就叫做微元;二階或以上微元的和式,都趨向於零,可以忽略不計。微元前麵的係數,可以理解為依附於此微元上的某種量的密度。在黎曼積分中,密度必須要是連續的才可積,至少是(充要條件),不連續點的集合具有零測度。
測度是幾何度量的推廣,有多種不同的測度,這裏說說Lebesgue測度。在k維歐氏空間R^k中的點集,可不隻有連續區域。在一維實數集R的區間 [0, 1] 構造出來的Cantor集,驚掉了所有人的下巴:把它三等分,去掉中間的三分之一;再對剩下的區間如此操作,無窮盡地進行下去。最後剩下的部分就是Cantor集。被去掉的區間的總長度為1;Cantor集的測度是0,還是一個無窮閉集。
一個有限區間(閉、開、或者半閉半開)的測度就是它的長度;不相交的可數個區間的測度,等於所有區間長度之和。一個集合的外測度,就是所有包含它的開區間的測度的下確界;內測度則是所有包含於此集合的有界閉集的測度的上確界。當外測度等於內測度時,該集就稱為Lebesgue可測的。不可測集合的結構是如此複雜,以至於不能賦予任何有意義的度量。Giuseppe Vitali在1905年還真是構造出了不可測的集合。可測函數由其取值範圍來定義:如果集合E{x: f(x) ≥ r} 或者 F{x: f(x) < r}對所有實數r可測,函數f就是可測的。可測函數可以用一個簡單函數列來逼近;可測函數在可測集上Lebesgue可積:int{f(x)dm: x E}可定義,其中m是Lebesgue測度。一些著名的黎曼不可積函數,如Dirichlet函數、黎曼函數,都是Lebesgue可積的。
Feynman積分是一個物體的作用(表示物體結構或能量信息的函數)沿所有連續曲線的和。為了保證收斂性,每一項需要乘以一個收斂因子。利用測度微元的思想,可以化為一個複圍道積分。在複變函數中,解析函數的表示就徹底自由了!如果再加上相對論的考量,引入四元數,弦的運動方程就可解,而不僅僅是基本粒子的概率幅度表示。
在概率統計中,隨機變量的序列有四種收斂性: (1)按照概率收斂,(2)以概率1收斂,(3)按分布收斂,(4)按照均值(期望值)收斂。概率其實就是隨機事件空間上的一種測度。對於連續型的隨機變量,可以定義概率密度,概率可以用積分表式示。離散型的隨機變量的概率,可以用和式表示。混合型的概率分布函數,用事件空間上的連續和表示:概率密度乘以空間度量的微元,然後對所有基本事件相加。和式的收斂性由分布密度的非負性、組合係數的非負性且和為1保證。
一個空間裏某種現象的發生的概率其實是未知的,我們需要通過抽樣去發現其統計規律。一個統計量,就是不含未知參數、隻依賴於觀測值的可測函數。我們可以去估計樣本的均值、方差、各階矩等等,用它們去接近母體的相關參數。對於獨立同分布的樣本,可以證明,它的Z-Score, 當樣本數趨向於無窮大時,Z-score按分布收斂於標準正態分布。也許我們可以把任何分布的Z-score近似地看成正態分布;但其均值與方差還是需要無偏一致統計量去估計。
一個大四學生上學期學了一門課,《概率論在工程中的應用》;他的感覺是,幾乎要用盡所有的大學數學知識;其實呢,統計學的方法都沒有涉及。我在大學裏學《概率統計》時,那個女老師隻會抄黑板,不會做任何原理的解釋;之後我就自己去把每一個細節弄清楚。現在,在一個純粹數學家的眼裏,概率論已經很完善了—沒有什麽可以值得研究的了。在物理學中,人們追求一個大一統的理論;但在數學中,這是不可能的:沒有一組式子能夠描盡天下所有現象,也沒有一組映射,能夠實現所有的變換。