相關係數小知識
(2010-06-06 20:47:00)
下一個
相關係數小知識
對於非統計背景的人士來說,讀有關涉及統計測量的文章可能會遇到一些理解上的困難。如果能有一定的統計常識,就能很好地提高自己的閱讀和理解水平。這裏,我用最淺顯的語言講解有關相關係數的理論知識。
所謂相關係數,指的是兩個相互有關的隨機變量(或隨機現象或事物)之間的隨機關係的統計測量,例如人類體重和身高之間的關係就可以用相關係數來描述。一般而言,身高高則體重重,但並非每個身高較高的人的體重都一定比一個身高較其矮的人的體重重。這類不確定的相關關係就是統計相關係數試圖要解釋的現象。
在統計學上,相關係數的理論測量範圍是閉區間[-1, 1]。這個區間可以被分解為三個臨界連續的子區間:[-1,0)、[0]和(0,1]。其中,[-1,0)表示負相關,即一個變化增加,而另一個則變小;0表示無關,即一個無論怎樣變化,另一個基本不變;而(0,1]表示正相關,即一個變化增加時,另一個也增加。然而,一個在數值上不等於0的相關係數(例如-0.1581或0.1675)可能在統計學上等於0,這就是關於相關係數的顯著性檢驗的問題。因此,一個相關係數是否等於0需要由一個顯著性檢驗的概率來判斷。如果這個概率值很小,則等於0的可能性就很小;反之,如果這個概率值較大,則相關係數等於0的可能性就比較大。例如,如果一個相關係數的檢驗概率值是0.0048,就意味著該相關係數等於0的隨機可能性隻有大約0.48%。這是一個極小的可能性,也就是說,如果按照一定的觀察、測量和計算分析的方法得到了一個相關係數及其檢驗概率值0.0048,得到該相關性的結論犯錯誤的可能性隻有0.48%。
在統計學上,有時候即使一個相關係數的絕對值在0.3,它等於0的可能性也許會達到50%甚至更高。因此,僅有相關係數的數值結果是遠遠不夠的,必須有一個顯著性檢驗的概率值才能對相關性作出合理的概率解釋。如果沒有檢驗概率值,就不能僅僅依據相關係數的正負性質和數值大小對相關性作出判斷。因此,如果一個相關係數的絕對值趨近於1,且檢驗概率值趨近0,則該相關性的結論就有很高的可信度。
那麽,為什麽除了要測量出相關係數,還要測量一個檢驗概率呢?這是因為,我們對兩個可能相關的事物間的相關性是通過對該同類事物的一個隨機部分的群體測量得到的。我們通常不能獲得對該群體的全部個體作出測量以得到一個終極結論,因為該群體中的個體數量一般是無限,例如研究成年男性的體重和身高之間的關係時就麵對著這樣的困境。因此,基於一個隨機部分群體的測量必然不是總體的真實結果,而是含有一個隨機誤差在內的結果。可以設想,如果換一個隨機部分群體,又會得到一個不一樣的結果,這些隨機部分群體之間的差異我們稱之為隨機誤差,而檢驗概率的作用就是要判斷這個隨機誤差在任何一次隨機群體測量中發生的可能性。
在長期的統計測量實踐活動中,人們從概率論的角度提出了以下約定成俗的概率判斷規則:
如果針對一個相關係數的檢驗概率等於或大於0.05,即100次隨機抽樣判斷中有至少5次以上的差異主要由隨機誤差引起,或者說隨機誤差占總誤差的可能性達到5%的水平或以上,那麽,我們就不能說該相關係數在統計上具有顯著性;反之,如果檢驗概率小於5%,那麽,我們就可以說隨機誤差的發生是一個“小概率事件”,而一個如此小的概率意味著該事件(即該相關係數中的隨機誤差)幾乎不可能發生,因而我們說該相關係數在統計學上有顯著意義。這種建立在一個檢驗概率上的推論又被稱為概率推斷(probabilistic inference)
那麽,人們會問:你所說的相關係數中的隨機誤差是指的對什麽的隨機誤差?這是一個非常好的問題。回答是這樣的:我們對相關係數的檢驗是建立在以下兩個假設基礎上的:
1)無效假設:相關係數等於0;
2)備選假設:相關係數不等於0。
顧名思義,第二個假設是為了防備無效假設被拒絕後作結論時的備選方案。由此可見,一個相關係數中的隨機誤差是指的對於一個為0的理論相關係數的誤差。因此,上述概率推斷又被稱為假設檢驗(hypothesis test)。
一般來說,最常用的相關係數有兩類。一個是Pearson線性相關係數,它是對兩個可連續測量的變量之間的關係的衡量,例如上麵提到的體重與身高之間的關係;另一個是Spearman等級相關係數,它是對用等級劃分手段進行測量的變量之間的相關關係的衡量,例如“對黑猩猩的差異性”與“文明創造能力”這兩個數值量化結果之間的相關關係。
值得在此指出的是,在人種色度與文明創造能力的相關性研究中,被研究的對象包括了迄今為止的一切人種、一切時代、一切文明成果,因此,它不是對一個“隨機部分”的隨機測量,而是關於該研究總體的全部測量,因此,其相關係數是一個在該研究設定的測量條件下的迄今為止的真值。而“迄今為止”僅僅是一個隨機時間點的選擇,並不代表未來的結論,因此,該相關係數仍然是一個隨機測量的結果,需要由一個來假設檢驗來作出概率推斷。