女子與數學 (2)gender gap
【上一篇 https://blog.wenxuecity.com/myblog/80301/202406/21236.html? 】
寫這篇文章的動機,並不是因為近來刷屏的薑萍,而是網友的一篇博文《數學,無關性別》。說的是她回國以後得知上初三的表哥的女兒,在數學上遇到了困難,嚐試請一位重點中學數學老師幫忙,而這位老師冷淡地表示,女生數學掉鏈子,無能無力……
同作者一樣,我不同意那位老師的態度,但我卻這樣回:
“數學有點不同於其他學科,事情真的比較複雜、難說。
在完全自由的選擇和類似的努力下,性別差異的確明顯。我曾經近距離、數年之間(因某種契機)深入了解過我們這個學區最好的約20多個 math kids,包括我自己的兩個孩子,我覺得總體上性別差異明顯。但這其中確有幾個個女生數學也是優秀的,其中兩個大學裏繼續學STEM。所以,對於個體來講不一定。
數學上最優秀者,兩性的比例大約是 1:10,這在任何別的學科都是沒有的,不能被歧視、偏見、自信心不足等來充分解釋。
…… 我可以寫一篇說這個問題,但不願意趟這涉嫌“歧視”的渾水,被人扔磚頭。”
她的回答中有兩點,我認為非常中肯:1. 就應付大學以前的數學考試而言,她覺得學習數學“開竅”很重要。2. 她不知道女孩是不是從小就被灌輸了性別的差異,因而從思想深處就對數學生出了惰性和怯意。
此外,她鼓勵我寫有關此問題的文章,不要管別人說什麽......
好吧,既然我有一些數據、觀察和有關的一些思考,就寫出來,言者無罪。
性別差異(gender gap)這種說法早就有,但經常是非常寬泛的,比如平均而言男人比女人力氣大,暴力犯罪率高,從政人數多,這些都是gender gap。(BTW,兩性的智商平均值沒有差異,盡管兩性在IQ測驗的分項上各有所長。)這裏,我們將“性別差異”範圍僅限於數學的能力或特長。
2009年,總部設在巴黎的國際組織“經濟合作與發展組織”(簡稱經合組織; Organisation for Economic Cooperation and Development,OECD)開始了一項為期3年,每三年重複的“國際學生評價計劃”(Programme for International Student Assessment (PISA)),通過測驗評價幾十個國家的15歲學生的數學和語言能力。本計劃的初衷主要是提供一個量化的、顯示不同國家初等教育水平的可比較數據,從而幫助各國製定教育政策。
PISA測驗的結果,除了反映各國的差距之外,也反映出了顯著性的性別差異 — 1. 在大部分國家,女孩的數學分數低於男孩;2. 在所有國家,男孩的閱讀水平低於女孩。這是其中一年的全部結果:
另一個反映性別差異的是SAT成績。下圖左側是40年間的SAT數學成績的對比。男生的平均成績始終比女生高30-40分。(但注意y坐標是從450而不是0開始,在視覺上“放大”了差異。)右圖是兩性在不同分數段出現的頻率,同樣表明男生在高分段比例高。(在700分以上,男女比約3 :2 )。
然而,統計表明在SAT閱讀考試上,兩性是沒有顯著差異的,有的年份女生還略有優勢。下圖是紐約州的Vassar College跨越10年,對其入校新生SAT的統計結果。盡管這所學校比較好,SAT的平均分比美國平均值要高很多,但趨勢是一樣的,即SAT閱讀兩性沒有顯著差異,但數學成績男性平均高15-25分。SAT兩個項目的結果表明,不能把女生數學分數稍低歸結為教育機會不均等。
現在我們已經知道有關現象了。為了更全麵的分析,我們做一個簡單的數學模型,並希望它與現實中的廣泛的觀察和測量相吻合。我盡量簡單地說,爭取解釋清楚:
在自然界、人類社會、以及心理學和教育學中,大量測量值表現為正態分布(normal distribution),比如人的身高、壽命、血壓、考試成績、智商等。正態分布有嚴格的定義,這裏不多說。正態曲線呈左右對稱的鍾型,兩頭低,中間高。均值附近出現的頻率最高,離均值越遠,出現頻率越低。均值μ和標準差σ是正態分布的兩個特別重要的參數。均值反映了分布在x軸的位置,標準差反映了離散的程度。如果σ 的值大,則分布比較發散,曲線比較扁平。
下圖左顯示了正態分布的特點,如在正負1個標準差之內,出現頻率高達68.2%,而大於3個標準差出現的頻率隻有0.1%。舉個例子:根據定義,標準智商測驗的均值是100,標準差是15。因此智商在85-115的人占了68.2%。而智商超過145的人隻有0.1% , 因為45是3倍的標準差。
上圖右是理解gender gap的關鍵:紅色虛線鍾形圖是整個人群(男女合並)的分布曲線。如果男性比女性有優勢,那麽男性的曲線將右移,而女性的曲線將左移。這個shift有多大呢,我對前麵PISA和SAT的數據進行了分析(不細說了),我的計算結果是gender gap大約是0.3個標準差。也就是說男性的曲線較兩性總和的曲線(紅色虛線)右移0.15σ,而女性則左移0.15σ。
這樣一個模型,它是不是大致準確呢?我們來看4種不同標準/水準下,兩性究竟表現出什麽樣的gender gap:
A、基本水準:定義為-1.5 σ以上。即經過一定的努力,一般的數學課至少可以及格。(注意,A包含B,C和D,但上麵的描述,是僅限於刨去B、C、D的情況)
B、優秀水準:定義為+1.5 σ以上。這樣的學生數學考試經常能得A,可以選AP數學,SAT數學經一定準備,能考700分以上。他們可能參加數學競賽,但獲得優勝比較難。他們在大學裏可以學STEM,但不是拔尖的學生。(B包含C和D,但上麵的描述,是僅限於刨去C、D的情況。)
C、英才水準:定義為+3 σ以上。這是數學的精英,他們 AP數學和SAT數學都不費勁就能夠獲得接近滿分的成績,在低級別的數學競賽中經常獲獎。到大學裏,他們也是STEM專業的優等生。
D、天才水準:定義為+6 σ以上。這是數學上的最尖端者,他們是在數學上有重大建樹、獲得數學大獎(包括菲爾茲獎)級別的天才。
好,現在我們來分別看。在下圖中,我們著重看右邊那個曲線下的綠色部分(大於z分值的發生概率),我用大字明確寫在圖的最右邊。依照該模型,作為總體,有93.32%的學生數學可以基本合格(比如可以及格)。由於根據有關數據推算的正負0.15 σ的shift,相當於對男性而言,數字變成了-1.65 σ以上,而女性變更成了-1.35 σ,對應為男生95.05%和女生91.15%數學可以基本合格。也就是說,達到數學基本要求的比例為1.04 :1,兩性是很接近的,女生與男生達到數學基本要求的人數差不多。
再看看“優秀水準”的情況,這樣的個體占整個人群中的6.68%。根據與上麵同樣的換算方式,男女的比例,實際上是比較1.35 σ以上的頻數和1.65 σ以上的頻數,這時男女比例比上麵一個圖增加了,大約是 1.8 :1。這個結果,與SAT數學考700分以上、數學課大多得A、選修數學AP等情況下,男女生的比例是基本吻合的。
【注:有關“C、英才水準”和“D、天才水準”的話題,我們留待下一篇再說。】
向看官致歉,本篇內容比較幹,比較boring。而且在沒有機理的情況下說數據,可能會被批評為有bias,甚至有“歧視”之嫌。這個問題的確比較複雜,男性比女性在數學上表現略強,可能是社會期待、個人信心以及生物原因綜合的結果。當要求較低時,女生幾乎與男生一樣好,也許是因為努力和訓練可以彌補輕微的劣勢。看官去看第一張圖,整個東亞地區,包括日,韓、新加坡、香港、上海,在那個比較簡單的PISA數學測試下,gender gap都是比較小的,我猜想一個原因可能是東亞文化強調用功,而女孩比男孩更自控一些。然而,用功的作用,在需要天賦的一些高難度操作中,作用就有限了。在國際奧林匹克數學競賽(IMO)選手中,男生比例很高,也許正是因為這個原因。
人做某件事情的動機的強弱,不僅取決於獲得成功後的喜悅和回報,而且取決於對成算的判斷和為獲得成功所需付出的代價。因此,盡管桃子對所有人都是好吃的,但“下山摘桃子”與“上山摘桃子”的勁頭是不同的。假如那山有兩千多米高,一名登山運動員颼颼就上去了,水蜜桃吃著舒坦!我老唐氣喘籲籲,爬了不到五百米就give up了。你們說我沒吃到桃子是因為自信心不夠強?
同意,大部分的gender gap不是科學問題,或不單單用科學就能解釋和解決。
不是同一組題的粗分,而是十幾個項目換算後的分數的加權,保證兩性均值相同。
因此,在validation階段,隻要改變不同分項粗分換算成標準分時的係數或權重就可以“再平衡”了。比如對詞匯和拚圖兩項的權重稍作調整。。。當然,這是一項複雜的工作,不是拍腦袋或者知道一點統計學就瞎來的。
另外,智商測驗有很多種。像Wechsler智商測驗這種高效度的測驗,是主試者與被試者一對一的測驗,不是一般的紙筆測驗。
第一次聽說智力測驗的設計目標之一,是讓同一組題目,讓男的平均值=女的平均值。漲知識了。
另外,標準差的區別也許能解釋一些現象。
女人標準差小,說明分布曲線高而窄,集中在中間,傻瓜少,神童也少。
男人標準差大,說明分布曲線矮而寬,兩側相對多,傻瓜多,神童也多。
男人的分布曲線寬,分布曲線的最左端的傻瓜裏,男人比女人多得多。
監獄裏關的,差不多都是男的,是不是說明傻瓜裏男人比女人多得多?
男人的分布曲線寬,也導致分布曲線的最右端的神童裏也基本上都是男人。
古今中外,以發明者命名的數學定理,差不多都是男人的名字,如歐幾裏得、牛頓。
即使讓一個數學係的學生隨便說出來一個以女人命名的數學定理,恐怕也很少人能說出來。
這是不是說明神童裏基本上都是男人?
學懂從小學到研究生的數學內容,男女都有能力。
但要突破前人的數學成就,曆史上也就幾千人,這裏麵絕大多數都是男的。
並不是想說明男女誰更棒。隻是根據已知的數據,看能不能解釋一些現象。
謝謝油翁點評。
【新林院】
您的意思是不是下麵的?
“智力測驗的設計目標之一,是讓同一組題目,讓男的平均值=女的平均值。”
換句話說,如果這兩個平均值不一樣的話,智力測驗的設計者會調整題目,使兩個平均值更接近。
是這個意思嗎?
是這個意思。
不管怎樣,過若幹年讀會有新版。出於種種原因,特別是文明社會人的智商傾向於越來越高(稱為 Flynn Effect),而且有的問題對新一代已經不適用了,所以常模總是要調整。
最新版的韋氏IQ測驗 WAIS-5,將在今年10月份公布。
新版本是個非常嚴肅的巨型課題,不是發現一點小問題、小不平衡,就改動。
我不肯定您的意思。
您的意思是不是下麵的?
“智力測驗的設計目標之一,是讓同一組題目,讓男的平均值=女的平均值。”
換句話說,如果這兩個平均值不一樣的話,智力測驗的設計者會調整題目,使兩個平均值更接近。
是這個意思嗎?
智商(IQ)反映一般性的的思維能力和語言能力,它與數學能力不是一回事。後者是很難定義的。研究表明兩者的相關性小於0.4,最多算是中等相關。
就我本人而言,我也認為兩者很不一樣。比如,我下麵回答網友時,我談到IQ的大致情況是兩性均值相同,但男性標準差大。而我上麵的文章的文字和圖很清楚,對於數學的性別不同,我是假定標準差相同,但均值有0.3個標準差的不同。。。
謝謝您的信息。當一個智力測驗做常模的時候,或者在另外一個國家或文化進行validation的時候,男女樣本在各個年齡段,在理想情況下是相等的(可以想見這個工作量相當大)。也就是說這個“標尺”的平均值在做norm的樣本下兩性是平衡的(這是智力測驗的設計目標之一)。
然而,當以這一的標尺去測量新的人群時,就會有各種可能的不同,既可能是常模的問題,也可能是被測查的人群的取樣問題。
如果被測人群的取樣沒有問題,IQ分出現係統的、反複的男比女高,那麽有兩個解決辦法,1. 對IQ測驗進行調整和re-validation,即對智商測驗的題目、特別是言語智商和操作智商的分項進行再平衡;2. 像國際象棋、圍棋那樣,男女有不同版的IQ。這麽做可能性幾乎為0.
研究數據不支持您的結論。
根據 Richard Lynn 的測試結果:
男:IQ 平均值 = 101.461
女:IQ 平均值 = 99.681
兩者 IQ 平均值區別非常小,但不能說完全相同。
【但男性群體的標準差大一些,比較發散,結果是男性的鍾形曲線比較扁,兩頭多一些。也就是說,與女性相比,男性特別聰明的和特別笨的都多一些。】
研究數據支持您的結論。
男:IQ 標準差 = 15.253(鍾形曲線比較扁,兩頭多一些)
女:IQ 標準差 = 14.085(鍾形曲線比較高而窄,兩頭少一些)
(我的上個留言沒寫清楚,請刪掉。謝謝。)
不要猜測我懂不懂什麽!有意義嗎?
我什麽也不掩蓋。這是技術貼,談數學能力。
你我不在一個頻道上。你何不自己去寫、去論證。
請注意你說話的方式。這是我的博客,不是你的園地,也不是公共園地。
我感覺,先生其實在技術上不了解IQ測驗,也不了解一般能力與特殊能力的區別。
但有打破“政治正確”的拳拳之心。。。我理解。。。
整體評價用統計學。
另外需要說明一點,即數學能力與智商是很不一樣,研究表明兩者最多隻有中等相關。我認識一個“神童”,智商很高,但他在競賽數學上的表現不突出。
IQ可以反映一般性的的思維能力和語言能力,與數學能力不是一回事。後者是很難定義的。
2019年1月14日
因多次發表種族決定智商的言論,曾獲諾貝爾獎的美國科學家詹姆斯·沃森(James Watson)被剝奪多項榮譽稱號。這位DNA研究的先驅者在電視節目中提到一種觀點:即基因會導致智商測試中黑人和白人的差異。
冷泉港實驗室(Cold Spring Harbor Laboratory)表示,這位90歲科學家的言論“毫無根據而且魯莽”。
沃森博士2007年提出過類似主張,但隨後道歉。
他於1962年與莫裏斯·威爾金斯和弗朗西斯·克裏克共同獲得諾貝爾獎。1953年他們發現了DNA的雙螺旋結構。2014年,沃森博士賣掉金牌,稱他發表種族言論後被科學界排斥。
此前他曾發生車禍,目前正在一家養老院康複。據說他目前對周圍環境的認知“非常小”。
DNA影響智商?
2007年,這位曾在劍橋大學卡文迪許實驗室(University of Cambridge's Cavendish Laboratory)工作過的科學家告訴《泰晤士報》,他“對非洲的前景一直很悲觀”,因為“我們所有的社會政策都是基於他們和我們一樣聰明的事實,但所有的測試結果都表明這不是真的”。
雖然他希望人人平等,但他補充道:“那些不得不與黑人雇員打交道的人發現這不是真的”。
發表這些言論後,沃森被解除實驗室負責人等所有行政職務。在書麵道歉後,他得以保留榮譽頭銜。
但冷泉港實驗室表示,他現在不再擁有這些頭銜。因為他在本月初美國公共廣播公司PBS播出的紀錄片《美國大師:解讀沃森》中表達了同樣的觀點。
該實驗室在一份聲明中說: “沃森博士的言論應該被譴責,根本沒有科學依據。”實驗室表示,沃森的道歉不再得到認可。
---------------------------------
黑白顛倒的時代!
這個人用的是什麽智商測驗?
因為標準差大,所以高智商組男性多(同時男性智障的也多),沒有IQ平均高5分這回事。但言語智商和操作智商的分項上有性別差異。
黑人作為整體,其智商低於白人和黃種人。這也不是什麽秘密。
------
白人比黑人的智商高。。。男性的智商比女性平均要高出五分。這一差異在高智商群體中尤其明顯:130分以上的男性人數比女性高出三倍;145分以上高達5.5倍。
不是事實。標準化智力測驗(如韋氏測驗)在validattion時,其norm分別按年齡,但並不分開性別。
-----------
"男性和女性的智商是分開測試的,各取平均值作為100分。"
德國之聲中文網2005年8月30日2005年8月30日
英國科學家在對10萬人進行測試後得出的結論大有挑撥離間的味道:男人的平均智商要比女人高。
https://p.dw.com/p/76zy
在同行們的眼裏,退休的心理學教授林恩(Richard Lynn)無疑是在玩火自焚。最近他的研究結果在英國學術界引起了軒然大波:14歲以上的男性比同年齡段的女性更聰明。
這一結論是在對10萬進行了思維能力測試之後得出的,並發表於最新一期的“英國心理學期刊”。本文的合作者厄爾文(Paul Irwing)是曼徹斯特大學的講師,他表示對這一結果感到非常遺憾:“就他個人來說,他當然願意看到另外的結果。但是科學真理往往事與願違。”
在此之前,林恩教授已經進行了一係列相關的科學研究,並得出了以下結論:白人比黑人的智商高;罪犯隱瞞犯罪事實是由基因決定的。人們不禁懷疑,這位科學家的煽動性難道也流淌在他的血管裏?
至今為止,各種研究男女大腦及其運作方式的心理學研究在得出結果時,都遵循小心謹慎的原則。男性和女性的智商是分開測試的,各取平均值作為100分。在測試不同國家人的智商時也采取相同的評分方法。這樣就避免了通過相互比較而作出帶有歧視性的評價。
林恩和厄爾文的研究忽略了性別差異,得出的結論是,男性的智商比女性平均要高出五分。這一差異在高智商群體中尤其明顯:130分以上的男性人數比女性高出三倍;145分以上高達5.5倍。在這一群體中包括諾貝爾自然科學獎的得主,象棋大師,數學天才等。事實也的確如此,在這些領域的佼佼者中,男女比例如此懸殊,很難把這種現象簡單歸因於環境的影響。
除了智商比較外,林恩和厄爾文還進行了更深入的比較研究:在智商相同的情況下,女性的工作能力更有效,更細致,而且更能適應長時間的工作。考慮到知識技能在不同職業,不同年齡階段的意義不同,在調查了各行業,各工齡的人後,他們發現智商數為125分的男女比例大致相同,
男性大腦的體積較大,而女性大腦網絡連接更密集,這一點已經得到科學證實。大腦兩個半球分別控製感性和理性思維,兩個半球之間的聯係更緊密、更頻繁,未必是一種優勢。女性在同時處理“理智與情感”交錯的問題時,表現得更好,她們承受壓力的能力也更強。然而在,處理複雜的數學難題時,她們往往受到直覺的影響。這道理就和電腦超負荷運行時,需要關閉一些軟件來提高速度一樣,這時候也需要切斷大腦兩個半球之間的聯係,以便使注意力高度集中。
男女在不同領域有不同天賦:在代數和幾何學上,女性很少有出類拔萃者,在空間概念上也略遜一籌。老生常談的“女人停不好車”,雖然被政治家視作社會歧視,但是卻得到了科學上的證實。通常行為學上的解釋是,男孩子在野外偵察等遊戲中得到了鍛煉,是由於環境因素導致了這一差別。這種說法現在看來並沒有觸及根本性的問題。另一方麵,女性更善於傾聽,她們從孩童時期起就顯示出較高的語言天賦和理解力。
這不是事實。男女的智商平均值是相同的,都是100,但男性群體的標準差大一些,比較發散,結果是男性的鍾形曲線比較扁,兩頭多一些。也就是說,與女性相比,男性特別聰明的和特別笨的都多一些。
JustWorld2024-06-30 18:22:37
...男性智商比女性高大約5%。
FYI, MIT 的學生中女生占 45%。
謝謝您的長留言。這個問題的確複雜。社會與家庭的是一個人成長的環境,其影響無法排除。
0.3個標準差的差異,在兩性學習機會基本均等的情況下,是不大能夠完全歸因於其他環境因素的。
日,韓、新加坡、香港、上海gap較小,不管是什麽什麽原因,麵對的還是中低難度。這表明,在一般難度下,女孩可以跟男孩學得一樣好。
然而,同樣是這幾個國家,每年層層選拔,最後參加IMO的,男生還是絕大多數,這說明somehow,在高難度數學競賽中,男性有優勢。
xy對xx染色體,是男女先天的基因不同,隨之而來的表現型的差異,我本人傾向於首先從生物角度去理解。比如在任何文化背景下,男性的暴力犯罪都是同文化環境下女性的數倍。我們恐怕無法用“教育不夠”和“對生命的熱愛不足”來解釋其根本原因,雖然這些都可能是影響它的因素。
男性大腦比女性大約10%。
男性智商比女性高大約5%。
另外,看北大清華錄取男女比列。2021年,男女比例約2:1。
如果能數值化相貌,不管是男女,統計相貌對數學或別的學科的影響,可能可以消除一些社會和家庭的影響。當然,相貌歧視也是一種社會和家庭的影響。