【女子與數學 (2)gender gap】
文章來源: 唐宋韻2024-06-30 13:49:06

女子與數學 (2)gender gap

寫這篇文章的動機,並不是因為近來刷屏的薑萍,而是網友的一篇博文《數學,無關性別》。說的是她回國以後得知上初三的表哥的女兒,在數學上遇到了困難,嚐試請一位重點中學數學老師幫忙,而這位老師冷淡地表示,女生數學掉鏈子,無能無力……

同作者一樣,我不同意那位老師的態度,但我卻這樣回:

“數學有點不同於其他學科,事情真的比較複雜、難說。

在完全自由的選擇和類似的努力下,性別差異的確明顯。我曾經近距離、數年之間(因某種契機)深入了解過我們這個學區最好的約20多個 math kids,包括我自己的兩個孩子,我覺得總體上性別差異明顯。但這其中確有幾個個女生數學也是優秀的,其中兩個大學裏繼續學STEM。所以,對於個體來講不一定。

數學上最優秀者,兩性的比例大約是 1:10,這在任何別的學科都是沒有的,不能被歧視、偏見、自信心不足等來充分解釋。

…… 我可以寫一篇說這個問題,但不願意趟這涉嫌“歧視”的渾水,被人扔磚頭。”

她的回答中有兩點,我認為非常中肯:1. 就應付大學以前的數學考試而言,她覺得學習數學“開竅”很重要。2. 她不知道女孩是不是從小就被灌輸了性別的差異,因而從思想深處就對數學生出了惰性和怯意。

此外,她鼓勵我寫有關此問題的文章,不要管別人說什麽......

好吧,既然我有一些數據、觀察和有關的一些思考,就寫出來,言者無罪。

性別差異(gender gap)這種說法早就有,但經常是非常寬泛的,比如平均而言男人比女人力氣大,暴力犯罪率高,從政人數多,這些都是gender gap。(BTW,兩性的智商平均值沒有差異,盡管兩性在IQ測驗的分項上各有所長。)這裏,我們將“性別差異”範圍僅限於數學的能力或特長。

2009年,總部設在巴黎的國際組織“經濟合作與發展組織”(簡稱經合組織; Organisation for Economic Cooperation and Development,OECD)開始了一項為期3年,每三年重複的“國際學生評價計劃”(Programme for International Student Assessment (PISA)),通過測驗評價幾十個國家的15歲學生的數學和語言能力。本計劃的初衷主要是提供一個量化的、顯示不同國家初等教育水平的可比較數據,從而幫助各國製定教育政策。

PISA測驗的結果,除了反映各國的差距之外,也反映出了顯著性的性別差異 — 1. 在大部分國家,女孩的數學分數低於男孩;2. 在所有國家,男孩的閱讀水平低於女孩。這是其中一年的全部結果:

另一個反映性別差異的是SAT成績。下圖左側是40年間的SAT數學成績的對比。男生的平均成績始終比女生高30-40分。(但注意y坐標是從450而不是0開始,在視覺上“放大”了差異。)右圖是兩性在不同分數段出現的頻率,同樣表明男生在高分段比例高。(在700分以上,男女比約3 :2 )。

然而,統計表明在SAT閱讀考試上,兩性是沒有顯著差異的,有的年份女生還略有優勢。下圖是紐約州的Vassar College跨越10年,對其入校新生SAT的統計結果。盡管這所學校比較好,SAT的平均分比美國平均值要高很多,但趨勢是一樣的,即SAT閱讀兩性沒有顯著差異,但數學成績男性平均高15-25分。SAT兩個項目的結果表明,不能把女生數學分數稍低歸結為教育機會不均等。

現在我們已經知道有關現象了。為了更全麵的分析,我們做一個簡單的數學模型,並希望它與現實中的廣泛的觀察和測量相吻合。我盡量簡單地說,爭取解釋清楚:

在自然界、人類社會、以及心理學和教育學中,大量測量值表現為正態分布(normal distribution)比如人的身高、壽命、血壓、考試成績、智商等。正態分布有嚴格的定義,這裏不多說。正態曲線呈左右對稱的鍾型,兩頭低,中間高。均值附近出現的頻率最高,離均值越遠,出現頻率越低。均值μ和標準差σ是正態分布的兩個特別重要的參數。均值反映了分布在x軸的位置,標準差反映了離散的程度。如果σ 的值大,則分布比較發散,曲線比較扁平。

下圖左顯示了正態分布的特點,如在正負1個標準差之內,出現頻率高達68.2%,而大於3個標準差出現的頻率隻有0.1%。舉個例子:根據定義,標準智商測驗的均值是100,標準差是15。因此智商在85-115的人占了68.2%。而智商超過145的人隻有0.1% , 因為45是3倍的標準差。

上圖右是理解gender gap的關鍵:紅色虛線鍾形圖是整個人群(男女合並)的分布曲線。如果男性比女性有優勢,那麽男性的曲線將右移,而女性的曲線將左移。這個shift有多大呢,我對前麵PISA和SAT的數據進行了分析(不細說了),我的計算結果是gender gap大約是0.3個標準差。也就是說男性的曲線較兩性總和的曲線(紅色虛線)右移0.15σ,而女性則左移0.15σ。

這樣一個模型,它是不是大致準確呢?我們來看4種不同標準/水準下,兩性究竟表現出什麽樣的gender gap:

A、基本水準:定義為-1.5 σ以上。即經過一定的努力,一般的數學課至少可以及格。(注意,A包含B,C和D,但上麵的描述,是僅限於刨去B、C、D的情況)

B、優秀水準:定義為+1.5 σ以上。這樣的學生數學考試經常能得A,可以選AP數學,SAT數學經一定準備,能考700分以上。他們可能參加數學競賽,但獲得優勝比較難。他們在大學裏可以學STEM,但不是拔尖的學生。(B包含C和D,但上麵的描述,是僅限於刨去C、D的情況。)

C、英才水準:定義為+3 σ以上。這是數學的精英,他們 AP數學和SAT數學都不費勁就能夠獲得接近滿分的成績,在低級別的數學競賽中經常獲獎。到大學裏,他們也是STEM專業的優等生。

D、天才水準:定義為+6 σ以上。這是數學上的最尖端者,他們是在數學上有重大建樹、獲得數學大獎(包括菲爾茲獎)級別的天才。

好,現在我們來分別看。在下圖中,我們著重看右邊那個曲線下的綠色部分(大於z分值的發生概率),我用大字明確寫在圖的最右邊。依照該模型,作為總體,有93.32%的學生數學可以基本合格(比如可以及格)。由於根據有關數據推算的正負0.15 σ的shift,相當於對男性而言,數字變成了-1.65 σ以上,而女性變更成了-1.35 σ,對應為男生95.05%和女生91.15%數學可以基本合格。也就是說,達到數學基本要求的比例為1.04 :1,兩性是很接近的,女生與男生達到數學基本要求的人數差不多。

再看看“優秀水準”的情況,這樣的個體占整個人群中的6.68%。根據與上麵同樣的換算方式,男女的比例,實際上是比較1.35 σ以上的頻數和1.65 σ以上的頻數,這時男女比例比上麵一個圖增加了,大約是1.8 :1。這個結果,與SAT數學考700分以上、數學課大多得A、選修數學AP等情況下,男女生的比例是基本吻合的。

【注:有關“C、英才水準”和“D、天才水準”的話題,我們留待下一篇再說。】

向看官致歉,本篇內容比較幹,比較boring。而且在沒有機理的情況下說數據,可能會被批評為有bias,甚至有“歧視”之嫌。這個問題的確比較複雜,男性比女性在數學上表現略強,可能是社會期待、個人信心以及生物原因綜合的結果。當要求較低時,女生幾乎與男生一樣好,也許是因為努力和訓練可以彌補輕微的劣勢。看官去看第一張圖,整個東亞地區,包括日,韓、新加坡、香港、上海,在那個比較簡單的PISA數學測試下,gender gap都是比較小的,我猜想一個原因可能是東亞文化強調用功,而女孩比男孩更自控一些。然而,用功的作用,在需要天賦的一些高難度操作中,作用就有限了。在國際奧林匹克數學競賽(IMO)選手中,男生比例很高,也許正是因為這個原因

人做某件事情的動機的強弱,不僅取決於獲得成功後的喜悅和回報,而且取決於對成算的判斷和為獲得成功所需付出的代價。因此,盡管桃子對所有人都是好吃的,“下山摘桃子”與“上山摘桃子”的勁頭是不同的。假如那山有兩千多米高,一名登山運動員颼颼就上去了,水蜜桃吃著舒坦!我老唐氣喘籲籲,爬了不到五百米就give up了。你們說我沒吃到桃子是因為自信心不夠強?