2007 (111)
2008 (219)
2009 (121)
2010 (101)
2011 (161)
2012 (183)
2013 (99)
2023 (1)
2024 (1)
華人家長對孩子的考試成績十分在意,也非常看重孩子的考試分數,認為考分就是對孩子學習成績的最終評判。可是,如果考試是給學生的學習成績打分,那麽誰,又如何來給考試打分呢?我們常常隻看到學生考試考得好不好,很少在意考試本身是否合理。
考試是一種測量工具,用以測量學生的學習成果。那麽既然是一個工具,就有一個精確度的問題,同時還有使用是否得法的問題。
中國是一個考試大國,兒童從小到大每走一步都必須經曆各種考試關卡,考試種類繁多,科目五花八門,僅國家級教委考試中心承接的考試就多達數百種!至於各類學校和教育機構自己命題實施的考試更是多如牛毛,難怪學生們整天都在題山卷海中掙紮。
考試如此重要,在中國往往決定了一個人的命運,那麽用科學思想指導命題以及對考試本身的質量進行科學的評判也就極為必要。
可喜的是,起源於心理測驗的現代教育測量學為我們對某一項考試做出定量準確的判斷提供了堅實的理論基礎。
我們衡量一把秤的準確與否,一是看它的結果是否可靠,二是看結果是否有效。
如果用同一把秤,同一個人前後接連兩次的體重相差甚遠,或是完全不符合此人的真實體重,這個測量結果不可靠,這把秤也就有問題了。即使秤本身很精確,但如果用它來測量一個人的身高,不管每次結果如何一致,也都無效。
同理,衡量考試的主要指標有兩條:效度和信度。
所謂效度,是指考試的結果是否有效,也就是說某次考試的結果是否反映了考察者所希望考察的內容。
我們不能用一把秤去測量一個人的身高,雖然身高和體重有一定的相關,可是現實中,我們常常會用不相關的考題去刁難學生。比如語文題中出現曆史知識或社會常識題,我曾看到語文考試中問學生“劉翔打破世界紀錄的成績是多少?”;再如小學低年級的數學應用題如果用過於成人化的語句陳述,造成閱讀理解困難,就不是在考數學了。還有一些所謂雙語學校的所有理科試卷都用外語命題,這都嚴重影響的考試的效度。試卷問非所指,不能怪學生答非所問。
《華盛頓郵報》曾刊登了一篇文章質疑中國的駕照考試,其中一個是這樣的
如果遇到腹部外傷﹐比如小腸流到外麵﹐應該如何處理﹕
A:把它放回腹腔;
B:不用處理;
C:不要放回去,用杯子或碗蓋住,然後用布帶紮起來。
這是醫學院的臨床測驗還是戰地的急救考試?如此駕照考試的效度就是一個大問號。
考試的信度,是指理論上同一學生重複做同一套試題所得分數的一致性。一致性越高,考試成績越可靠,其誤差就越小。一把精確的秤,不管你重複站上去多少次,所得到的體重都是一致的。當然,人的因素很不穩定,影響個人成績的變量也多種多樣,所以我們不能用理論上的方法驗證信度,但是通過一係列的數理統計方法,信度和效度都可用定量指標來衡量。
提高考試的效度,所提的問題要和希望考察的目標要一致,比如說,拿數學試卷考物理,雖然兩門學科有一定關聯,但成績應該視為無效。提高信度,就要排除一切試題中模糊的指令,容易引起學生誤解的語句或者明顯透露答案的“送分”內容——比如前一道題的閱讀內容恰好是後一道問題的答案,或是試題本身的疏忽。
比如讓學生看了4幅圖片後填空:
There is an ______on the table. (apple, pear, peach, banana)
答案當然是apple, 學生甚至不需要知道這些單詞的含義。
考試作為一種工具,它的功能和表現形式也是多種多樣的,使用者如果不按自己的需求隨意將一組問題集中起來考問學生,這樣的考試就沒有任何公信力。考試的目的不同,就要使用具備相應功能的試卷才能達到預期的目的。
考試按照其功能可分為:
選拔性考試:目的不是看學生學得怎樣,而是以選拔者自己的標準,篩選出自己認為優秀的學生,如升學考試。
診斷性考試:目的不在排名次,而是向醫生看病那樣發現學生學習上的薄弱環節,以製定出相應的補救措施。
形成性考試:學習過程中的階段測驗,目的是考查學生的學習進度,為教學提供參考。
終結性考試:學習結束時的考試,目的是檢驗一門學科的教學成果,如期末考試。
按照分數的解釋方法,考試可分為:
準則參照考試:命題的原則是嚴格按照教學目標,難易適中,不出超出教學範圍的題,學生的原始得分與試題掛鉤,從得分中可以直接看出學生的成績。
常模參照考試:將每一個學生放在總體樣本中,學生的原始分被轉換成標準分,所以分數不是學生的答題得失,而是學生在總體樣本中的位置。比如我們熟悉的托福成績,滿分是120分,如果一個學生得了100分,並不是說他答錯了20題,而是說明他的成績大約高於97%的學生(按平均分60, 標準差20計算)。
再按照考試的規模,又可分為大規模標準化考試和普通課堂考試……
我們學校中常見的考試一般都是形成性的準則參照考試,理應重視其診斷作用和為教學做參考的功能。
有人批評考試是指揮棒,其實錯誤不在指揮棒,而是使用指揮棒的人。我們理應讓考試成為輔助教學的工具,但不幸的是,許多考試一味追求拉開學生差距,許多教師甚至故意用教學大綱之外的難題偏題刁難學生,家長也熱衷於為孩子們排座次,似乎一定要把學生分出個子醜寅卯來才罷休,這樣一來,考試為教學反饋的重要職能被忽略了,同時又助長了為學生加班加點,教學圍著考試轉的歪風。
考試的目的如果是為了檢驗學生的學習狀況,何必要決出各高低呢?如果老師教學有方,學生學得好,全班都是100分才好呢,不是嗎?如果全班多數學生都不及格,也不一定是學生都沒學好,或許是試題太刁鑽,老師沒有盡職呢!
學生沒有考好,請不要單單指責學生。老師在給學生打分的時候,也應該給考試打打分。