唐宋韻_文學城博客

女子與數學（2）gender gap

寫這篇文章的動機，並不是因為近來刷屏的薑萍，而是網友的一篇博文《數學，無關性別》。說的是她回國以後得知上初三的表哥的女兒，在數學上遇到了困難，嚐試請一位重點中學數學老師幫忙，而這位老師冷淡地表示，女生數學掉鏈子，無能無力……

同作者一樣，我不同意那位老師的態度，但我卻這樣回：

“數學有點不同於其他學科，事情真的比較複雜、難說。

在完全自由的選擇和類似的努力下，性別差異的確明顯。我曾經近距離、數年之間（因某種契機）深入了解過我們這個學區最好的約20多個 math kids，包括我自己的兩個孩子，我覺得總體上性別差異明顯。但這其中確有幾個個女生數學也是優秀的，其中兩個大學裏繼續學STEM。所以，對於個體來講不一定。

數學上最優秀者，兩性的比例大約是 1：10，這在任何別的學科都是沒有的，不能被歧視、偏見、自信心不足等來充分解釋。

…… 我可以寫一篇說這個問題，但不願意趟這涉嫌“歧視”的渾水，被人扔磚頭。”

她的回答中有兩點，我認為非常中肯：1. 就應付大學以前的數學考試而言，她覺得學習數學“開竅”很重要。2. 她不知道女孩是不是從小就被灌輸了性別的差異，因而從思想深處就對數學生出了惰性和怯意。

此外，她鼓勵我寫有關此問題的文章，不要管別人說什麽......

好吧，既然我有一些數據、觀察和有關的一些思考，就寫出來，言者無罪。

性別差異（gender gap）這種說法早就有，但經常是非常寬泛的，比如平均而言男人比女人力氣大，暴力犯罪率高，從政人數多，這些都是gender gap。（BTW，兩性的智商平均值沒有差異，盡管兩性在IQ測驗的分項上各有所長。）這裏，我們將“性別差異”範圍僅限於數學的能力或特長。

2009年，總部設在巴黎的國際組織“經濟合作與發展組織”（簡稱經合組織； Organisation for Economic Cooperation and Development，OECD）開始了一項為期3年，每三年重複的“國際學生評價計劃”（Programme for International Student Assessment (PISA)），通過測驗評價幾十個國家的15歲學生的數學和語言能力。本計劃的初衷主要是提供一個量化的、顯示不同國家初等教育水平的可比較數據，從而幫助各國製定教育政策。

PISA測驗的結果，除了反映各國的差距之外，也反映出了顯著性的性別差異 — 1. 在大部分國家，女孩的數學分數低於男孩；2. 在所有國家，男孩的閱讀水平低於女孩。這是其中一年的全部結果：

另一個反映性別差異的是SAT成績。下圖左側是40年間的SAT數學成績的對比。男生的平均成績始終比女生高30-40分。（但注意y坐標是從450而不是0開始，在視覺上“放大”了差異。）右圖是兩性在不同分數段出現的頻率，同樣表明男生在高分段比例高。（在700分以上，男女比約3 ：2 ）。

然而，統計表明在SAT閱讀考試上，兩性是沒有顯著差異的，有的年份女生還略有優勢。下圖是紐約州的Vassar College跨越10年，對其入校新生SAT的統計結果。盡管這所學校比較好，SAT的平均分比美國平均值要高很多，但趨勢是一樣的，即SAT閱讀兩性沒有顯著差異，但數學成績男性平均高15-25分。SAT兩個項目的結果表明，不能把女生數學分數稍低歸結為教育機會不均等。

現在我們已經知道有關現象了。為了更全麵的分析，我們做一個簡單的數學模型，並希望它與現實中的廣泛的觀察和測量相吻合。我盡量簡單地說，爭取解釋清楚：

在自然界、人類社會、以及心理學和教育學中，大量測量值表現為正態分布（normal distribution），比如人的身高、壽命、血壓、考試成績、智商等。正態分布有嚴格的定義，這裏不多說。正態曲線呈左右對稱的鍾型，兩頭低，中間高。均值附近出現的頻率最高，離均值越遠，出現頻率越低。均值μ和標準差σ是正態分布的兩個特別重要的參數。均值反映了分布在x軸的位置，標準差反映了離散的程度。如果σ 的值大，則分布比較發散，曲線比較扁平。

下圖左顯示了正態分布的特點，如在正負1個標準差之內，出現頻率高達68.2%，而大於3個標準差出現的頻率隻有0.1%。舉個例子：根據定義，標準智商測驗的均值是100，標準差是15。因此智商在85-115的人占了68.2%。而智商超過145的人隻有0.1% ，因為45是3倍的標準差。

上圖右是理解gender gap的關鍵：紅色虛線鍾形圖是整個人群（男女合並）的分布曲線。如果男性比女性有優勢，那麽男性的曲線將右移，而女性的曲線將左移。這個shift有多大呢，我對前麵PISA和SAT的數據進行了分析（不細說了），我的計算結果是gender gap大約是0.3個標準差。也就是說男性的曲線較兩性總和的曲線（紅色虛線）右移0.15σ，而女性則左移0.15σ。

這樣一個模型，它是不是大致準確呢？我們來看4種不同標準/水準下，兩性究竟表現出什麽樣的gender gap：

A、基本水準：定義為-1.5 σ以上。即經過一定的努力，一般的數學課至少可以及格。（注意，A包含B，C和D，但上麵的描述，是僅限於刨去B、C、D的情況）

B、優秀水準：定義為+1.5 σ以上。這樣的學生數學考試經常能得A，可以選AP數學，SAT數學經一定準備，能考700分以上。他們可能參加數學競賽，但獲得優勝比較難。他們在大學裏可以學STEM，但不是拔尖的學生。（B包含C和D，但上麵的描述，是僅限於刨去C、D的情況。）

C、英才水準：定義為+3 σ以上。這是數學的精英，他們 AP數學和SAT數學都不費勁就能夠獲得接近滿分的成績，在低級別的數學競賽中經常獲獎。到大學裏，他們也是STEM專業的優等生。

D、天才水準：定義為+6 σ以上。這是數學上的最尖端者，他們是在數學上有重大建樹、獲得數學大獎（包括菲爾茲獎）級別的天才。

好，現在我們來分別看。在下圖中，我們著重看右邊那個曲線下的綠色部分（大於z分值的發生概率），我用大字明確寫在圖的最右邊。依照該模型，作為總體，有93.32%的學生數學可以基本合格（比如可以及格）。由於根據有關數據推算的正負0.15 σ的shift，相當於對男性而言，數字變成了-1.65 σ以上，而女性變更成了-1.35 σ，對應為男生95.05%和女生91.15%數學可以基本合格。也就是說，達到數學基本要求的比例為1.04 ：1，兩性是很接近的，女生與男生達到數學基本要求的人數差不多。

再看看“優秀水準”的情況，這樣的個體占整個人群中的6.68%。根據與上麵同樣的換算方式，男女的比例，實際上是比較1.35 σ以上的頻數和1.65 σ以上的頻數，這時男女比例比上麵一個圖增加了，大約是1.8 ：1。這個結果，與SAT數學考700分以上、數學課大多得A、選修數學AP等情況下，男女生的比例是基本吻合的。

【注：有關“C、英才水準”和“D、天才水準”的話題，我們留待下一篇再說。】

向看官致歉，本篇內容比較幹，比較boring。而且在沒有機理的情況下說數據，可能會被批評為有bias，甚至有“歧視”之嫌。這個問題的確比較複雜，男性比女性在數學上表現略強，可能是社會期待、個人信心以及生物原因綜合的結果。當要求較低時，女生幾乎與男生一樣好，也許是因為努力和訓練可以彌補輕微的劣勢。看官去看第一張圖，整個東亞地區，包括日，韓、新加坡、香港、上海，在那個比較簡單的PISA數學測試下，gender gap都是比較小的，我猜想一個原因可能是東亞文化強調用功，而女孩比男孩更自控一些。然而，用功的作用，在需要天賦的一些高難度操作中，作用就有限了。在國際奧林匹克數學競賽（IMO）選手中，男生比例很高，也許正是因為這個原因。

人做某件事情的動機的強弱，不僅取決於獲得成功後的喜悅和回報，而且取決於對成算的判斷和為獲得成功所需付出的代價。因此，盡管桃子對所有人都是好吃的，“下山摘桃子”與“上山摘桃子”的勁頭是不同的。假如那山有兩千多米高，一名登山運動員颼颼就上去了，水蜜桃吃著舒坦！我老唐氣喘籲籲，爬了不到五百米就give up了。你們說我沒吃到桃子是因為自信心不夠強？


	【女子與數學（2）gender gap】
	文章來源: 唐宋韻於 2024-06-30 13:49:06