當日衝之路

縱橫馳騁華爾街 那是我的快樂與自豪 ...............
個人資料
正文

Laser Trading Systems 中的數學公式 01

(2006-05-20 07:21:08) 下一個

放空單的統計分析:

一組數值自平均值分散開來的程度的一種測量觀念。一個較大的差,代表大部分的數值和其平均值之間差異較大;一個較小的差,代表這些數值較接近平均值。

例如,兩組數的集合 {0, 500, 900, 1400} 和 {500, 600, 800, 900} 其平均值都是 700股 ,但第二個集合具有較小的差。

差可以當作不確定性的一種測量。在物理科學中,做重複性測量時,測量數值集合的差代表這些測量的精確度。當要決定測量值是否符合預測值,測量值的差占有決定性重要角色:如果測量平均值與預測值相差太遠(同時與差數值做比較),則認為測量值與預測值互相矛盾。這很容易理解,因為如果測量值都落在一定數值範圍之外,可以合理推論預測值是否正確。
定義及簡易計算公式
假設有一組數值 x1, ..., xN (皆為實數),其平均值為:

此組數值的差為:

一個較快求解的方式為:

一隨機變量 X 的標準差定義為:

須注意並非所有隨機變量都具有差,因為有些隨機變量不存在期望值。 如果隨機變量 X 為 x1,...,xN 具有相同機率,則可用上述公式計算標準差。

從一大組數值當中取出一樣品數值組合 x1,...,xn ,常定義其簡易標準差:

這裏示範如何計算一組數的標準差。例如一分鍾內放空單的數值級別為 { 500, 600, 800, 900 } :

第一步,計算平均值

. n = 4 (因為集合裏有 4 個數),分別設為:
用 4 取代 N
此為平均值。
第二步,計算差
用 4 取代 N
用 7 取代

此為差。

正態分布的規則

在實際應用上,常考慮一組數據具有近似於正態分布的機率分布。若其假設正確,則約 68% 數值分布在距離平均值有 1 個差之內的範圍,約 95% 數值分布在距離平均值有 2 個差之內的範圍,以及約 99.7% 數值分布在距離平均值有 3 個差之內的範圍。稱為 "68-95-99.7 rule"。

差與平均值之間的關係
一組數據的平均值及標準差常常同時做為參考的依據。在直覺上,如果數值的中心以平均值來考量,則標準差為統計分布之一"自然"的測量。較確切的敘述為:假設 x1, ..., xn 為實數,定義其公式

使用微積分,不難算出 σ(r) 在下麵情況下具有唯一最小值:

幾何學解釋
從幾何學的角度出發,標準差可以理解為一個從 N 維空間的一個點到一條直線的距離的函數。舉一個簡單的例子,一組數據中有3個值,x1, x2, x3。它們可以在3維空間中確定一個點 P = (x1, x2, x3)。想象一條通過原點的直線 L = {(r, r, r) : r ∈ R}。如果這組數據中的3個值都相等,則點 P 就是直線 L 上的一個點,P 到 L 的距離為0, 所以標準差也為0。若這3個值不都相等,過點 P 作垂線 PR 垂直於 L,PR 交 L 於點 R,則 R 的坐標為這3個值的平均數:

運用一些代數知識,不難發現點 P 與點 R 之間的距離(也就是點 P 到直線 L 的距離)是σ√3。在 N 維空間中,這個規律同樣適用,把3換成 N 就可以了。

[ 打印 ]
閱讀 ()評論 (2)
評論
fbifbi 回複 悄悄話 股票市場或者衍生市場,高斯分布假設不成立。簡單例子,股票退出交易後,其概率為零。高斯分布的區間為正負無窮。之所以有些時候仍然是用此假設,是因為利率變動長期看,期望為零。
交易中最重要的是個股之間,各股與市場指數之間的相關性。市場風險無法回避,沒有風險規避,任何交易無法長期保證獲利。無論用那些局部函數來幫助預測。
交易數量差對多數人來說不透明,大交易商可以操縱。
登錄後才可評論.