關於人種或種族之間的智商差別,尤其是所謂黑人智商比白人低的問題,一直是個敏感話題。
黑人天生比白人智商低的觀點在西方主流社會曾長期流行。各種關於智商測試成績的統計數據成為這種種族智商差別觀點的主要證據。最近的資料包括一份2001年的論文,有人統計了6百萬多份美國的認知能力測試成績,發現黑人和白人的平均成績差別為1.1個標準差。這樣的差別也反映在諸如SAT和GRE等大學入學考試以及招工和征兵的測試成績中。有人認為這些測試成績的差別就證明了黑人天生比白人智商低。
但是,近幾十年來學術界經過大量的調查研究,並未發現能夠解釋不同人種或群體間智力水平差別的基因遺傳學證據,相反,有大量證據顯示環境因素才是造成群體間智商測試成績差別的基本原因。隨著學術界研究的開展和認識的深化,黑人天生比白人智商低的觀點已經在西方主流社會漸漸失去市場。但它在華人圈裏卻依然盛行。
最近因“黑人命也是命”運動在華人圈子裏引起熱烈辯論,有些人又把黑人天生智商低的觀點提出來,隱隱約約地作為黑人處於美國社會經濟地位劣勢的合理解釋,或作為否定相關社會改革必要性的理由。
黑人是否“天生”就比其他人種智商低?前人有這種認識的依據是什麽?現在的學術界對此有什麽新的發現和認識?基於我的閱讀理解,我試圖從以下幾個方麵來說明這個問題:
一、智商測試的曆史
在二十世紀之前,這種在智力上對白人和黑人的高低認定,完全是基於作者的個人觀察和主觀判斷,沒有什麽統計依據。法國人戈賓諾在1853年出版的書《論人類種族的不平等》在西方社會影響巨大。他把雅利安人視為最優秀的人種,而且認為是雅利安人種給世界上所有的文化帶去了高貴血液、藝術和知識。他聲稱,在白人、黑人和黃種人之間比較,黑人的體質強壯但智力思維能力低下,黃種人體質和智力都一般但奉行實用主義使得他們能夠獲得一些成就,隻有白人在體質和智力上都是上等的,白人可以完成智力思維和美的創造,而且在體態上也是美麗的。他進一步聲稱,美、智力和力量等特質本來都是白人壟斷的東西,黑人和黃種人帶有的這些好的特質都隻因為有了和白人種族間的婚姻而引起的。
到了二十世紀,隨著科學技術和統計方法的發展,一些人就試圖從統計和科學的角度來證明和解釋白人智力高黑人智力低的觀點。其中發揮主要作用的就是智商測試方法的發明。
心理學家Binet因法國教育部的要求在1905年發明了一套測試學生智力的方法。Binet當時就提醒說,這種智力測試結果不應該被誤解為個人內在不變的智力標誌,隻能用於發現學生間的潛力差別。Binet的測試方法很快被翻譯介紹到英語世界,從此IQ測試作為一種智力測試方法就流行起來了。
第一次世界大戰期間,心理學家Terman用他改編的IQ測試方法對美國應征新兵進行了測試。根據這些測試數據,Terman發表文章認為,墨西哥裔美國人、非裔美國人和土著美國人表現的遲鈍(dullness)看來是一種人種屬性,或者是從他們的家族族係繼承來的。一些心理學家和優生學提倡者也根據這個測試數據認為,來自南歐和東歐的移民的智力比來自北歐的移民智力低,黑人美國人比白人美國人智力低。
這些基於統計數據的論點很快被美國白人至上組織和反移民團體廣泛應用。一些人聲稱,北歐人種的純正高貴性正受到來自世界其他地區移民的威脅,號召政府限製來自北歐以外地區的移民,並控製“不良人群”的出生比例。這些觀點流行開來,導致美國的某些州於1920年代開始實施了限製“有問題人群”出生率的“優生法”,並在歐洲刺激了德國納粹種族主義消滅“不良人種”的暴政。
在這些種族歧視觀點興起的同時,也有越來越多的學者開始認真審視那些智商測試方法和統計數據,發現了把人種和智力差距聯係一起的主張背後的種種邏輯毛病。許多人類學者證明,關於智力的人種遺傳主張是不科學的。很多科學家開始反駁這些優生學家的觀點,認為這種智商測試結果並不能真正反映個人的內在智力,他們指出許多環境因素比如測試語言等都可以造成測試成績的偏差。但是,把人種和智力高低差別聯係在一起的主張和爭論在美國一直存在,各種相關研究也一直進行著。
二、詹森的智商基因遺傳理論
1950-60年代,在美國社會關於隔離和反隔離的政策論戰中,一些智商測試成績又被用來支持黑人和白人人種在智力上有天生差別的主張。詹森(Jensen)於1969年發表在《哈佛教育評論》上的論文,引用和發展了英國心理學家斯皮爾曼早期的g-factor理論來解釋這個差別,從而以“科學理論”的名義把IQ測試成績的差別和被測試者的基因遺傳直接聯係在一起。
斯皮爾曼(Charles Edward Spearman)早在20世紀初就發現,一個人在不同類型的認知能力測試(比如閱讀理解和數學)的成績之間存在著相關性;某些認知能力測試,或某種不同認知能力測試的組合,能夠在一定程度上反映個人的內在智力;通過某種計算方式就可以估計這個成績和本人的智力相關程度。他進一步把能反映個人智力的各種因素分成一般因素(g-factor)和特殊因素,認為一般因素是最能反映智力內在本質的東西。他說,就像人的身高一樣,體育訓練可以在一定程度上增加身高,但不可能讓每個人都達到一樣的身高,智力訓練無論如何也不可能讓一個人的智力超越由本人的g因素所決定的智力高度。他就此設計了一套複雜的針對g因素的測試方案,把不同測試組合和其所能體現的智力相關程度稱為g-loading,它必然處於0-1之間,通常處於0.1 – 0.9,認為越高的g-loading組合越能反映一個人的真正智力。
詹森繼承了斯皮爾曼的理論,並認為決定g-factor的因素就是遺傳因素。而根據他的方法來分析,介於黑人和白人之間的IQ測試成績的差別80%就是由針對g-factor的能力測試成績的差別造成的。詹森據此認為,黑人和白人的IQ測試成績的差別就反映了他們在基因遺傳上的差別,而這是不可能通過後天努力來改變的。他的結論就是,旨在提高黑人學生IQ成績的教育輔助計劃是不可能成功的。
詹森的論文同時招來了大量支持和反對的聲音,成為美國心理學界最有爭議也是被引用最多的論文之一。除了來自學術界的批判和支持,他本人一方麵因為這些研究獲得來自諸如Pioneer Fund等種族主義組織的巨款支持,同時也招致反種族歧視組織的公開反對,詹森本人和家庭甚至收到人身威脅和恐嚇。
一些學者反駁詹森的觀點指出,即便重點考慮IQ測試中的g-factor,教育因素和環境變化也可能極大地改變受測試者的成績。同時,這類智商測試的成績也在很大程度上受到被測試者先前接觸這類測試形式的個人經驗的影響,所以,用這個測試成績的差別來證明遺傳因素的差別是極其不恰當的。
所幸,美國社會推動反種族隔離政策的步伐沒有受到類似詹森理論之類太大的阻礙,並在20世紀下半葉取得了長足的進展。但是,詹森的觀點在美國社會有廣泛的支持,甚至在科學界也很有市場。
1994年一本叫The Bell Curve的書出版。心理學家Herrnstein 和政治學者Murray 在書中認為,智商測試成績不僅受到遺傳因素的影響,而且它也是個人未來發展的很好的預測性指標,包括個人未來的經濟收入、職業表現、私生子和犯罪嫌疑可能性等。他們辯稱,那些有高智商的人,所謂“認知精英們”,是和那些平庸的或智力低下的人完全不同的。
本書使用的資料並不是來自新的研究成果,而隻是對舊有資料的重新整理分析,其中大量引用了詹森的論文資料。作者不僅和詹森一樣把不同人種的智商測試成績差別和基因遺傳主觀地聯係在一起,而且更以此推出許多種族歧視和隔離的政策建議,比如認為較高的低智商移民生育率導致了美國整體人口智商下降等等。該書出版發行之後,立刻引起了巨大的爭議。在它遭到大量來自科學家和社會各界的批判的同時,也有54名學者簽名公開信支持這本書的作者,簽名者其中就包括詹森本人。
對這本書的批評意見,首先是認為作者沒有做嚴謹的科學調查研究,並違反科學著作出版的通常做法,不在出版之前廣泛征求同行審閱評議。據報道,作者在該書出版前隻給媒體發送了幾份篩選過的同行專家審閱意見,卻把批評意見刻意隱瞞到著作出版之後幾個月甚至幾年才公開。其他專家則指出該書在統計方法、事實扭曲、邏輯謬誤等各方麵的錯誤,並認為作者是選擇性地使用舊資料為既定的社會達爾文主義論點進行扭曲辯護。Nicholas Lemann批評道,毫不意外地,這些調查研究方法的錯誤全都發生於有利於作者既定觀點的方向上。
由於The Bell Curve引起的觀點爭論衝突如此激烈,美國心理學協會組成了一個11名成員(包括三位在支持The Bell Curve集體聲明上簽名的)的專家組,發表了一份專家組意見報告,Intelligence: knowns and Unknows。該報告並不針對The Bell Curve的具體內容進行評判,而是“旨在澄清該領域的相關科學事實,說明哪些是科學已知的,哪些是處於爭論中的,哪些是尚未知的”。該報告於1996年發表在《美國心理學家》雜誌上。
專家報告指出:IQ測試成績和學生的學業表現以及將來的工作表現之間的相關性是已知的科學事實;環境和遺傳都對IQ成績有影響,有證據顯示隨著兒童年齡的增長遺傳因素對其智商測試成績的影響更加明顯;這種遺傳因素的具體內容和影響尚不清楚,而某些環境影響是已經很清楚的;已知對智力有一定程度影響的生物學因素包括營養、接觸有毒物質、以及產前的因素等。
對於群體間的IQ測試成績差別,報告指出,在不同族群之間的成績表現差異是複雜的,沒有表現出總體上有規律可循的明顯模式。具體來說,亞裔的IQ成績既有略高於白人群體的,也有略低於白人群體的。同時,某些亞裔的IQ成績低於100,但其職業表現卻高於通常IQ是110-120的人群,這一點強烈地提醒人們用IQ成績作為未來職業表現預測指標的局限性。報告認為,黑人群體比白人群體的IQ測試成績差距是明顯而且一貫的,但是造成這個差距背後的原因尚不清楚。可以肯定的是,這個差距不是源於簡單的測試內容和方法上的偏見。對於這個黑白人種的成績差距,已經有幾種基於文化背景的解釋,但是這些解釋並不能形成結論性的意見;基因水平上的實驗證據就更少。總之,針對表現在黑人和白人之間的IQ測試成績差別目前尚無可信服的解釋。
專家組報告並沒有支持The Bell Curve被廣泛批評的主要觀點,也就是關於黑白人種之間IQ測試成績的差別與基因遺傳的密切關係。但是,多年之後,事件的中心人物詹森在接受采訪時卻表示,專家組的報告既沒有支持也沒有反駁他的論點,其實是回避了這個問題。
三、“人種”不是科學概念,智商人種差異論在科學上沒有立足點
美國心理學會的那份專家組報告在承認群體間IQ測試成績差別在統計學上存在的同時指出,同樣不能忽略的事實是,不同人種群組內的測試成績差異遠大於群組間的差異,也就是說這樣的組合劃分在科學上是沒有實質意義的。專家們並指出,報告中使用的人種分類概念本身就有問題,所謂黑人、白人或黃種人,它們在分類方法上既不是一致的,也不是同質的。
的確,“人種”並不是一個科學概念。目前比較一致的意見是,以膚色劃分的人種隻是一個社會學的概念,它是缺乏生物分類所需要的科學根據的。簡單地說,膚色深淺是一個連續的變量,並無一個具體的分界限。而人類基因研究成果也發現,白人、黑人、黃種人等等之間並無可用來標示各自屬性的明確的基因組差別。人類基因組庫在所有人群中都是一樣的,隻是具體某種基因組合在等位基因上的表現頻率會有所不同,而這種基因頻率的不同也是一個連續的變化係列,並無明確的分界線。也就是說,無論是用膚色還是用基因作為標準,人類都不可能被科學地劃分為不同的人種。
基於對人種概念的誤解造成的社會影響深遠,美國體質人類學會(American Association of Physical Anthropologists)2019年發表聲明明確指出:“人種概念不能準確反映人類的生物學差異。過去使用這個概念時就從未準確過,用它來指稱現在的人類群體也依然不準確。依據生物學的證據,人類既無法按大陸板塊來區分,也無法以人種基因群集來分類。”
方舟子在其科普文章《人種與基因:人類的同一性與多樣性》中對人種概念的非科學性有詳細介紹,推薦大家閱讀。
既然“人種“不是一個科學概念,那麽存在於黑人和白人之間的IQ測試成績的差別,在科學意義上就不可能用人種差別來解釋,隻能是作為群體差異現象來研究。而體現這種差異的群體,就像分屬北方人群和南方人群、鄉村人群和城市人群一樣,隻是人口地理統計和社會學討論的概念,並沒有生物學上的分類意義。
四、關於智商遺傳的研究
美國心理學會1996年的專家組報告指出,關於智商測試的有效性,很難做不同文化之間的比較,但的確能預測受測試學生未來可獲得的教育成就的差別。從這個意義上來說,它是一種很好的教育前途預測指標,這一點是沒有偏見的。這個觀點,也得到其他心理學專家比如Mackintosh(1998)和Brown等人(1999)的認同。因此,群體間智商測試成績的差別如果真實存在,不論它是來自何種原因,對其進行研究是有必要的。
某些心理學家通過孿生同胞和領養兒童的研究認為,智力具有很高的可遺傳性。他們並根據美國的調查數據判斷,兒童早期的IQ成績30-50%由遺傳因素控製,青少年後期則高達75-80%。
但批評者認為這類研究是建立於錯誤的假設之上的。他們指出,和生物學的可遺傳性(heritability)不同,這個概念用在行為心理學上就變得非常含糊而誤導公眾。在生物學上,一個生物特質的可遺傳性是指一個可以觀察的特質在群體差異總量中由基因差異造成的差異值占總差異值的比例。可遺傳性1表示完全由基因決定,0則表示該特質和基因毫無關係而完全由環境決定。而在心理學測試中,可遺傳性通常被理解為被測試人的測試結果和他們的生物父母的測試結果之間的相關程度。但是,孩子與父母的相關性其實並不能解釋其相關的原因到底是基因遺傳還是家庭環境影響。真正的可遺傳性,應該隻是源於基因的遺傳。基於這樣的認識,The Heritability Fallacy的作者Moore和David Shenk等人認為,Heritability(可遺傳性)這個詞的使用極大地混淆了人們對人類發展個人特質和身份過程的真正理解。
對於這種傳承相關性和基因遺傳的區別,Noam Chomsky進一步用婦女戴耳環的習慣來說明:幾年前還隻有女性才戴耳環,可以認為女性戴耳環的可遺傳性非常高,因為戴不戴耳環看來完全和一個人的染色體到底是XX還是XY密切相關,但是沒有人會認為戴不戴耳環是編輯在我們的基因之中的。
弗林和Mackintosh等審閱分析了多種關於孿生同胞和領養兒童智力差別的調查報告,認為這些結果是相互混淆矛盾而不一致的,無法據此得出智商遺傳性的結論。
二十一世紀以來,科學家開始探索與智力相關的人類基因。有論文報告說,科學家到目前還沒有發現任何一個單一基因對智力(主要是以G因素為代表)有顯著影響,沒有一個單獨基因變化對智力變化的影響效果是大於0.5%的。因為智力是一種綜合特質,影響它的基因如果有也肯定也不是單一的,一定是一組,很可能多達幾千個基因。有人提出了一些可考察的候選基因群,但是對這些影響智商的基因的研究鑒別並不成功。由Deary等人發表於2009年的研究項目表示,並未發現可以證實這些候選基因群的可靠證據。以孿生兒童智力發育研究著名的Robert Plomin相信,影響智力考試成績的數量性狀基因座(QTL)應該是確實存在的,但是因為它們單個的影響如此之小,要從海量基因組裏把它們鑒別出來就非常非常困難,必須要等待更先進的技術才能發現它們。
Nisbett在發表於2012年的評論中總結說,幾乎沒有發現任何表現一致地對IQ變化值的相關程度是在可接受範圍內的基因多樣性。他們認為,也許這樣的基因組根本就是不存在的,智商考試成績的差別也許應該完全由環境因素來解釋。Mackintosh對此表示同意。
五、環境對智商測試成績的影響
另一方麵,關於環境對智商影響的研究報告卻很多。首先舉三個經常被引用的顯示環境對黑白人群IQ成績影響的研究報告:
環境因素對IQ成績影響的最明顯和廣泛的證據,大概是來自新西蘭科學家弗林(Flynn)的調查發現:在整個20世紀IQ測試者的成績都在逐年上升。這個現象被稱為“弗林效應”。美國一直到1998年幾乎是呈線性上升趨勢。弗林認為,引起這些智商測試成績上升的因素,顯然是環境而不是遺傳基因的作用。有人認為弗林效應的最重要意義,是顯示了環境對智商測試成績的影響可以達到1個標準差的移動範圍,而這一點以前是被懷疑的。
弗林效應的另一個現象是,黑人的平均測試成績也一樣逐年上升,而且其上升速度高於白人,使得黑人和白人的平均智商測試成績差別在逐年縮小。一份由弗林等人所做的經廣泛同行審閱的2006年的報告指出,從1972年到2002年間,黑人白人的智商測試成績距離縮小了大約三分之一。
心理測試統計專家Mackintosh同意詹森對於g-loading、智商傳承性和測試成績差距的相關性的觀察,但不認為這些就能證明智商成績差距源自基因遺傳。他說,正是那些詹森看到的承擔最大g-loading和傳承性的測試內容,在弗林效應中顯示了黑人測試成績的最大攀升,說明它們很可能也是最容易受環境因素影響的方麵。
哪些環境因素影響到智商?大量研究資料證明,健康和營養,教育,以及社會經濟狀況都會影響到參試者的IQ的測試成績。
Mackintosh認為,對黑人的社會偏見也是影響到黑白人群之間智商測試差別的因素之一。還有研究指出,處於社會不利地位的少數族裔出於對這種智商測試的價值否定,也影響到他們的測試結果。但這些假定難以得到重複證明。
另外,也有很多學者對IQ測試方法在體現不同社會背景的群體間智商差別的客觀性提出質疑。
Mackintosh 2011 年的論文指出,這些智商測試很大程度上受到被測試人以前是否接觸過這類測試中包含問題的個人經驗的影響,所以用來說明遺傳層次的內在潛質是不恰當的。
Hampshire等人(2012)仔細分析了詹森用來測IQ的方法後提出質疑:首先非常不明確的是,智商測試的成績差別到底是源於傳承,還是由於人口統計學變量(比如社會經濟狀況等)的差別;更重要的,這些差別到底反映整體智力水平的差別,還是因為測試設計隻傾向於複雜智力係統中的某些特殊成分?
弗林(Flynn)則認為,無論造成智商測試成績的差距是什麽,人們可以期待,隻要測試題越複雜,成績差距就會越大。所以,G-loading(詹森認為測試成績和其體現的智商水平的相關度)和測試成績差距之間的關係是無法用來解釋造成差距的原因的。Mackintosh也同意,幾項環境因素對IQ成績差距的影響已經得到證明,而基因影響的證據之少幾乎是可以忽略不計的。
六、可能與智商有關的其他生物學變量
除了基因和環境,有些學者也試圖從其他生物學特征上發現和黑白人群智商測試成績差距相關的因素,但是都並未得到學術界的支持。這裏隻介紹兩種。
大腦對刺激的反應時間差距似乎和IQ測試成績的差距有一定程度的相關性。這種刺激反應時間被認為是和大腦處理信息的效率有關的,於是有些研究者就試圖通過不同種族間對刺激的反應時間的差別比較來解釋IQ測試成績的差距。
有調查報告顯示,黑人、白人和亞洲人的刺激反應時間和他們的智商測試差距的順序是一致的,但是黑白人之間反應時間的差距沒有IQ的差距大。詹森等認為,刺激反應時間的差距和文化因素應該毫無關係,必然是遺傳基因的影響。
但是,Nisbett等就指出,詹森他們忽略了在同一個調查數據中也顯示在被測試者中IQ較高的華人平均刺激反應時間卻比歐裔美國人更長。Mackintosh同意Nisbett的意見並指出,除了反應時間,很多其他認知測試的結果也沒有顯示出IQ那樣的結果差距。他進一步指出,恒河猴的反應時間比美國大學生還短,說明反應時間也許根本不能說明智力。
另一種觀點認為腦容量的大小和智商有關,而黑白人群的腦容量不同可以解釋他們之間的IQ測試成績的不同。有人調查了黑人和白人群體的腦容量,發現被調查的黑人群體腦容量平均值要小於白人群體。但這種解釋麵對的明顯反對證據是,男女群體的腦容量平均值也有差別,通常男性腦容量大於女性平均值,但調查顯示男女性群體的IQ測試成績並無明顯差別。所以,腦容量無法解釋被調查的黑人群體與白人群體的IQ成績差別。
七、傳統印象的反例
黑人智商測試表現比白人低並不是一個始終一貫的現象,也有很多例外。
比如英國2010-2011年的調查發現,尼日利亞裔學生和加納裔學生的平均成績都遠高於白人學生平均水平。2014年英格蘭的一項針對學生的數學測試合格率的調查顯示,在11個不同語言背景組裏的非裔黑人學生都比學生的整體平均通過率要高;有四個非裔黑人學生組的通過比例是90%,而白人英國人學生的通過比例是84.6%。而統計2017-2018年學生的英語和數學考試成績,以高分數通過考試的比例,非裔黑人學生是44.3%,白人英國學生是42.7%。
八、結束語
總結以上的各種調查研究可以得到一個基本概念:詹森的黑白人種智商差別的基因遺傳理論在科學上是站不住腳的;目前呈現在黑白人群之間的智商測試成績的差距根本上並非源於人體的基因遺傳,而是複雜的社會和家庭環境因素造成的。
換句話說,如果把智力用語言表達能力來說明,那麽一個人具備智識能力就像一個人具備語言表達的能力一樣,肯定是基因遺傳的貢獻;但是一群人和另一群人之間的IQ智商測試成績的差別,就像不同人群針對某種特定語言的詞匯量和表達能力的差別,應該不是因為群體間基因成分的差別,而是來自包括地理、家庭曆史文化背景、教育以及經濟等等多種複雜的環境因素造成的綜合結果。
基於這樣的認識,不僅我們沒有理由歧視性地認定黑人智商天生不如其他人種,而且,基於增進人類共同發展的原則,如果相信智商測試成績的確能夠預示個人的社會發展前途,決策者們就更有必要審視現行的社會製度和政策,盡量排除那些影響智商發展的社會環境因素,促進不同族群的共同發展。
黃未原,2020-08-04