為了研究布朗運動和了解金融市場(賭博機製),人們在19世紀後期開始了隨機過程的研究。Brownian Motion命名來自於丹麥植物學家Robert Brown;他在1827年用顯微鏡觀察了一種名叫Clarkia Pulchella的植物的花粉沉入水中時的運動情況。在1905年,將近80年之後,阿爾伯特·愛因斯坦把花粉粒子的運動描述為受到水分子的趨動。他先是推出了花粉粒子的擴散方程;擴散係數與粒子的均方速度有關,再用一些物理量去表示擴散係數。
具體來說,愛因斯坦把粒子的位移(位置函數的增量)看作一個隨機變量Δ;它具有一定的概率密度f(Δ,Δt); 即粒子從時空位置(t, x)移到另一位置(t + Δt, x + Δ)的概率密度【要求位移與時刻t無關,即分布密度布不具有記憶】。另一方麵,假設粒子的分布密度為g(x, t);按照粒子數目的守恒,應當有g(x, t + Δt) = Integral{g(x + Δ,t) f(Δ,Δt) dΔ:Δ從負無窮到正無窮}。把g(x + Δ,t)作泰勒展開,再忽略Δ的二階以上的項,便導出了擴散方程。愛因斯坦據此可以確定原子和分子的大小,以及1摩爾即Avogadro常數的值。
在布朗運動中,每秒鍾就有多達10^14的互撞,經典力學的方法無法確定粒子的位移。在微觀世界裏,沒有了確定的運動定律,留給人們的隻有一個個的隨機過程;多體運動的方程式無法求解,我們隻能探尋其概率分布規律。1923年,美國數學家Norbert Weiner完全解釋了一維布朗運動,因此有了以他的名字命名的一種特殊隨機過程—Weiner過程。第一個用數學語言描述布朗運動的是數學家Thorvald N. Thiele;他在1880年發表了第一篇關於布朗運動的文章。在1900年, Louis Bachelier的博士論文 “投機理論” 提出了股票和期權市場的隨機分析。
現在對隨機過程的一般數學定義如下。給定一個樣本空間O,O的部分或全部子集構成一個隨機事件空間R(要求滿足三條公理:包含全集O、包含子集A的補集、包含可數個子集的並集),在R上有一個概率模型P,即從R到實數區間 [0, 1] 的一個函數,也滿足三條公理:全概率性P(O) = 1,可數可加性,事件獨立性。(O,R,P)稱為一個概率空間。
對於樣本空間O上的任何實值函數X(o), o為O的子集,如果對任意實數r,集合A = {o: X(o) ≦r}屬於R(即是一個隨機事件),那麽X(o)就稱為一個隨機變量。如果X的值域是可數的,X稱為離散型的;如果X的值域具有連續基數,那就稱為連續型的。它的概率分布函數定義為cdf(X, r) = P{X ≦ r}。對於連續型隨機變量,其概率密度函數pdf(X, r) 定義為cdf的導函數(可以是廣義的導數);對於離散型隨機變量,其概率密度定義為cdf的差分。這樣,cdf(X, r)可以用積分或者級數表出。
實際上,任何一個非負實值函數f(r)都是某個隨機變量X的分布函數(在某個概率模型P下),隻要它滿足:(1)非單調減少,(2)右連續,(3)在負無窮大的值為0,在正無窮大的值為1。此時可以定義一個隨機變量X,使得概率P(X ≦ r) = f(r)。
一個隨機變量的分布由它的各階矩Sigma{r^k pdf(X,r):r遍曆全體實數}, k = 0, 1, 2, 。。。唯一確定。這些矩都可以積分化,無論是連續型或是離散型。一些常見的隨機分布,如正態分布、指數分布、泊鬆分布、二項分布等,其pdf可以由一階矩和二階矩完全確定。人們因此把一個概率模型寫為{P(c): c是一些參數} 。c可以由一些矩完全確定。但由於pdf的表達式通常是未知的,人們隻能用抽樣去估計各階矩,這便有了大數定律與中心極限定理。
一個隨機過程是一族依賴於時刻的隨機變量:{X(t,o): t屬於某個參數集T};這些隨機變量的取值範圍稱為狀態空間S(每一個可能的取值稱為一個狀態);在S上具有某種概率分布P。這裏的參數集T可以是離散的,標記為整數集N = {0, 1, 2, 。。。}; 也可以是連續的,如某個非負的實數區間。這個時刻參數不同於隨機變量自身所包含的參數c, 它是記錄過程變化的參數,比如隨機遊動、布郎運動(Brownian Motion)中的時刻。在前者,X(t)是一個賭徒在時刻t時所處的位置(直線或閉路上的一個點); 在後者,X(t)可以是一個粒子在時刻t的位置、狀態等等。隨機過程的實例還有、股票和匯率的波動、波的頻率波動、能量的波動等。
作為隨機遊動的一個例子,我們考慮一個賭博的進程。假設開始時的本金為$a > 0,每次賭注為$1, 每輪贏的概率為p, 輸的概率為q = 1 – p. 第n輪時的全部身家(Fortune)Fn是一個隨機變量;可以表示為Fn = a + X1 + X2 + … + Xn, 其中Xk 是第k輪的輸贏,即+1如果贏了,-1如果輸了。Xk的平均值(期望值)是p – q = 2p – 1。Fn的概率分布是P(Fn = a + m) = nC((n+m)/2) p^((n+m)/2) q^((n-m)/2), 若 m與n同奇偶性;否則P(Fn = a + m)的值為零;m的取值範圍從-n到+n。
人們關心的一個問題是:何時身家清零?我們定義一個正整數N0 = min {n > 0: Fn = 0} 。可以算出N0為有限數的概率 P(N0 < ∞) = 1如果p ≦ ½; 如果p > ½, 則這一概率為 (q/p)^a。計算方法是,用遞推法找出在清零之前達到某個值b > a的概率P(Nb < N0), (一旦清零就算輸了),從而算出P(N0 < Nb) = 1 – P(Nb < N0), 讓b趨向於無窮大,算出極限值。這就是賭徒自毀!如果贏的概率不超過50%,總有一天要歸零!
處理隨機過程的方法通常是有限維度化,因為時刻總是無窮多的(可數或連續),我們隻能通過有限維度去窺探無窮維度。選取有限個時刻t1 < t2 < …< tn, 我們研究n個隨機變量X(t1, o),X(t2, o), …, X(tn, o)的聯合分布。最常見、可計算的概率分布是正態分布。如果任何有限時刻的聯合分布都是正態分布(概率密度函數的對數是各變量x1, x2, …, xn的二次多項式),這種隨機過程就稱為正態隨機過程。聯合分布的密度函數通常在獨立性的要求下容易求出,它可以表示為每個變量的分布密度的乘積,但隨機過程中的隨機變量不一定具有獨立性,我們轉而研究條件分布。
指數型分布具有時刻的無記憶性:P(X > t + s|X > s) = P(X > t)與時刻s無關,Markov過程延續了這一要求:X下一時刻所處的狀態,隻與當前時刻有關,而與再往前的時刻無關。我們先假設狀態空間S是離散的:S = {s1, s2, …, sk, …} (圓周上的隨機遊走還是有限狀態的)。先定義一個狀態轉移概率P(i, j) 為從狀態si轉移到狀態sj的概率(例如老鼠走迷宮,走進相鄰房間的概率);P(i, i) = pi表示保持狀態si的概率,是狀態空間S上的一種概率分布。無時刻記憶的要求可表示為
P(X(t(n+1)) = s*|X(tn) = s(kn), X(t(n-1)) = s(k(n-1)), …, X(t1) = s(k1)) = P(X(t(n+1)) = s*|X(tn) = s(kn)).
離散時刻T = {0, 1, 2, 。。。} 的Markov過程可以用轉移矩陣M = (P(j, i)),以及初始狀態的分布P(X0 = si) = π(i) 完全確定:在時刻t = n時的概率函數(行矢量) {P(Xn = si), i = 1, 2, …. } = {P(x0 = si), i = 1, 2, …} M^n。我們希望當n趨向於無窮大時, {P (Xn= si): I = 1, 2, …} 有極限:極限分布就是穩定分布。一種概率分布{ m(i):i = 1, 2, …}稱為是穩定的(Stationary), 如果有{m(i), i = 1, 2, …. } = {m(i), i = 1, 2, …} M;即{m(i): I = 1, 2, …} 為矩陣M的特征向量;
一個Markov過程稱為是不可約的,如果從任何一個狀態si可以到達任何狀態sj。也就是說,對於兩個狀態si和sj,總存在一個正整數n, 使得在M^n = (P^n (i, j)) 中【無窮階矩陣的運算按照無窮級數進行】,項P^n (i, j) > 0; 也有另一個m(或同於n),使得P^m (j, i) > 0。
一個狀態si的周期定義為使得 P^n (i, i) > 0 的所有正整數n的最大公約數p。如果每個狀態的周期都是1,那麽這個Markov過程就稱為無周期的(或者遍曆的)。可以證明,如果所有的P(i, j) > 0,那麽Markov鏈一定是無周期、不可約的。如果它還具有穩定分布,那麽它的極限分布一定是那個穩定分布,不論初始分布{ π(i)} 如何。
對於連續時刻T={t ≥ 0}及離散狀態空間S的隨機過程{X(t): t ≥ 0},無時刻記憶性可表示為 P{X(t + s) = sj|X(s) = si} = Pij(t) 與時刻s無關(隻與時間t有關),Pij(t)稱為狀態轉移概率函數,它滿足Sigma{Pij(t): j = 1, 2, ….} = 1 對所有t > 0, i = 1, 2, 3, … 成立。對所有的t, s > 0,Pij(t + s) = P{X(t + s + r = sj|X(r) = si)} = Sigma{P{X(t + τ) = sj|X(τ) = sk} P{X(r + s) = sk|X(r) = si} = Sigma{Pik(t) Pkj(s): k = 1, 2, 3, ….},此即Chapman--Kolmogorov方程。
為了保證Pij(t)的連續性,即要求當s趨向於0時有Pij(t) = Sigma{Pik(t)Pkj(0): k = 1, 2, …}對所有t > 0成立,必須且隻需Pkj(0) = 0對k ≠ j, 而Pjj(0) = 1。在此條件下,當t趨向於0時,極限lim{Pij(t)-Pij(0)}/t) = Qij存在;矩陣Q = [Qij]稱為Markov過程的Q矩陣。由此可以推出轉移概率的微分方程:dPij(t)/dt = Sigma{QikPkj(t): k = 1, 2, …} = Sigma {Pik(t)Qkj: k = 1, 2, …} 。
最簡單的一個例子是Poisson過程。它通常表示等待某個事件發生的時間;如通過路邊一個檢查點的第n輛汽車;一個城市發生第n次火警的時刻。它的轉移概率為Pij(t) = (ct)^(j – i) Exp(-ct)/(j – i)! 如果j ≥ i;如果 j < i,Pij(t) = 0。它的Q矩陣是保守的,也就是說,對所有整數i,Sigma {Qij: j = 1, 2, …} = 0。穩定(初始)分布{pi}的定義與離散時刻類似,即要求對所有t > 0, 有Sigma {pi Pij(t): i = 1, 2, …} = pj。不可約的定義也與離散時刻類似。
一類最常見的隨機過程是Weiner過程,即一維布朗運動的模型。隨機變量B(t), t ≥ 0,滿足以下條件:(1)B(0) = 0,B(t)滿足正態分布N(0,t)對所有t > 0;(2)B(t)具有獨立的增量,即對任意有限個時刻0 < t1 < t2 < …< tn,隨機變量B(t1), B(t2) – B(t1), …, B(tn) – B(t(n-1))互相獨立,(3)對任意的t > s > 0, B(t) – B(s)滿足正態分布N(0, t – s)。布朗運動可以通過一維的隨機遊走取極限來進行模擬。通過布朗運動B(t),可以構造各種擴散過程。如令X(t) = a + bt + cB(t),a是初始值,b是平均增長率,c表示擴散的隨機程度。容易算出,E(X(t)) = a + bt,Var(X(t)) = c^2 t,X(t)滿足正態分布。
對於一般的連續時刻T、連續狀態空間S的隨機過程{X(t): t屬於T},為了展開分析(定義方差、獨立性、相關性、各階矩等),首先必須要求平方均值是有限的:E{|X(t)|^2} = Integral{|X(t)|^2 dP(|X(t)| < x)} 為有限數,這裏X(t)可以取複數值,|X(t)|為其模。在此條件下,可以定以均值m(t) = E(X(t))與協方差B(t, s) = E{(X(t) – m(t)) (X(s) – m(s))*},其中*表示取共扼複數。B(s, t)是一個非負實函數。在均方收斂的條件下,可以定以均方連續、可到、可積的概念。可以證明,如果B(s,t)黎曼可積的話,X(t)在實數軸上可積:Intgral{X(t)dt}為有限數。
目的是要探尋穩定的隨機過程。如果均值m(t) = m為常數(與時刻t無關),協方差函數B(t, s)隻依賴於時間t – s: B(t, s) = R(t – s),則稱{X(t): t屬於T}為一個平穩過程(Stationary);R(t)稱為相關函數。它具有積分表示:R(t) = Integral{Exp(itu) dF(u)}, F(u)是一個右連續、有界、非降的實函數,稱為平穩過程的譜函數。對於離散時刻,積分區間從—π到π; 對於連續時刻,積分區間是整個實軸。平穩過程{X(t)}具有譜表示:X(t) = Integral{Exp(itu) dZ(u)},Z(u) 是一個具有正交增量的隨機過程:E{|Z(u) – Z(v)|^2} = F(u) – F(v), u > v。
譜密度dF(u)/du代表譜係的分布;電磁波的譜係本質上是能量算子的特征值,這與轉移矩陣或Q矩陣的特征值相關。能量包含動能與勢能,動能為正,勢能為負。在宏觀世界裏,引力勢能起主導作用;在微觀世界,電勢能起主要作用。Schrodinger的電子運動方程其實隻是動能+電勢能作用下的一個隨機過程。在超微觀世界裏,是一種色勢能或者光勢能在起主要作用,可惜的是,人類物理界對此尚無一種譜表示。
看來,我們還要加強隨機遊走,增加負能量,而不要動態清零,這樣才能當上這個宇宙的永世皇帝。