高頻量化交易,最常見的有兩種:
做市商是從股票買賣 bid/offer 的差價中獲取利潤的,我對做市商沒做過太多的研究,盡管高頻做市交易肯定也需要算法,但我的感覺是算法相對簡單。相比較而然,能否搶得先機,也就是能否在別人進入交易所服務器之前先獲取數據,更為重要,這也是為什麽很多做市商把計算機係統搬到離交易所服務器近的地方,或者接入光纖主幹道,以提高獲取數據的速度,也就是說,他們主要是靠硬件,或者說是靠蠻力取勝的。
而統計套利,也就是量化交易大牛Jim Simons采用的方法,靠的是智,也就是複雜的算法。
下麵就簡單介紹一下統計套利最基本的一點概念。
統計套利始於配對交易(Pairs Trading),最初是由Morgan Stanley一個年輕的程序員Gerry Bamberger開創的。Bamberger發現,每當有大額股票交易時,股票的價格就會有很大的波動,而交易完成後又會回到原來的價位。比如,某公司要賣掉大額的福特股票,起初的價格是15元,大額交易賣完後,價格很可能會跌倒14.5元,交易完後過一段時間,又會回複到原來的15元。他就想如何抓住這穩賺的0.5元利差,於是,他開始使用所謂pairs trading操作手法,在14.5元價格時long 福特, 同時Short 相似的股票GM做為對衝,這樣就可以穩拿0.5的價差。
理論化地做一下延伸,如果一個時間序列(Time Series),比如說股票的價格序列,是平穩型(Stationary)的隨機過程,滿足隨機正太分布,那就可以知道它的分布規律,並通過分布規律獲利。比如,如果我們知道股票A的價格波動是平穩的隨機過程,股票的價格大多都在8~12元之間震蕩,那隻要低於8我們就可以買,高於12就可以賣,這樣就可以獲利。
這其中的關鍵是數據序列必須要平穩,也就是說要有規律可循。
而在實際中,單個股票很少有完全滿足平穩型隨機過程的。如果單個數據序列不是平穩的,那如果把兩個或多個時間序列整合成一個時間序列,無論是加減乘除還是別的操作,是否可以變成平穩的?如果能,就說明這些序列之間存在著協整性(Cointegration),如果新合成的時間序列是平穩的,一樣可以利用它來獲利。
打個比方,如果你去遛兩隻狗,每隻狗的牽狗繩的長度是固定的,一個是3米,一個4米,往常你都會沿著固定的路線去遛狗,今天你想換一種遛法,你來到一個廣闊的原野,或者來到一個諾大的廣場,往常是你遛狗,今天是狗遛你,狗願意走到哪裏,你就跟到哪裏。顯然,按照這種走法,兩條狗各自的行走路線是毫無規律可言,不是平穩的。但是,兩條狗之間的距離,卻是個平穩的隨機過程,應該在0~7米間波動(假定你永遠牽著狗)。
如果把上麵兩條狗的行動路線看成是兩個股票序列A和B,各自是毫無章法可言,但A-B組成的新序列(相當於兩條狗之間的距離),是個平穩的過程,可以用來獲利,比如,如果A和B平日的差價是0~7元,一旦超出這個正常範圍,就可以從中套利。
配對交易,隻有兩個之間相互對衝,風險太大。統計套利是把配對交易的兩個股票,擴展到一籃子股票, 有long 的, 有short的, 也就是不僅是兩個時間序列,而是擴展到多個時間序列,這一籃子股票也許各自不是平穩的, 但是合到一起組成一個新的序列,確是平穩的序列,這樣可以從中獲利。至於選哪個股票, 倉位多少,何時買賣,這就是Jim Simons比別人高明的地方。
統計套利做為一種均值回歸方法, 是一種市場中性(market neutral)的策略, 也就是說理論上與大市的上下波動無關,盡管在實際中很難完全做到。
寫這些,是鼓勵別人去嚐試這種方法呢?
恰恰相反,我絕不鼓勵普通人去嚐試統計套利,包括我自己。至少,我不會去嚐試一種世上隻有一個人能做成功的方法。容易成功的方法和途徑多的是,何必要去選最難的那一種?!
而普通的配對交易,還是比較容易做的,至少從算法上來講,難度不大。當然,是否能盈利,盈利多少,不好說。比如,金價和銀價,銀價和銅價,或者是同行業類似的股票之間,無論是差價,還是價格之間的比例,是否存在著獲利空間,這個從算法上來講是很容易的。
不鼓勵別人去做,那還寫它幹什麽?有的同學肯定會質疑。
還真是,如此說來,這篇文章還真是多餘的!
建寧 2025/8/30