當前位置：科普教育 > 教育綜合基礎知識 > 第十章學習測評

第十章學習測評

　　曆年考題分析

　　考情分析：

　　從近五年的考試分數分布表可以發現，從分值來看，考試分值在整個試卷中的一直非常低，2010年為1.5分，2011年和2012年僅為1分，2013年為0分，2014年為1分。從考試題型來看，四種主觀題型在本章均沒有出現過，僅出現過選擇題。從本章內容及考試分布來看，本章屬於次要章節。具體來說：

　　選擇題。2010年出現兩道選擇題，分別考查考生對信度定義、形成性評價與總結性評價的區分等內容的掌握；2011年則考查考生對效度定義的掌握；2012年考查難度在不同取值範圍的含義；2013年沒有出現選擇題；2014年以計算機等級考試屬於何種評價類型的形式來考查考生對幾種測量與評價類型的區分。

　　主觀題。簡答題、判斷分析題、論述題和材料分析題在五年中均沒有出現。

　　應考攻略：

　　從上麵的分析中我們可以看出，本章內容屬於次要章節，應減少時間和精力分配在該章的知識點上。在複習應考過程中，主要針對選擇題的知識點來加以備考，特別應牢牢把握測量與評價的類型、各種類型測量與評價的定義、有效測驗所具備的幾個必要條件等常考知識點。

　　本章典型過關習題

　　一、單項選擇題

　　1.一個測驗能夠測量出所要測量的東西的程度稱為（）

　　A。效度

　　B。信度

　　C。難度

　　D。區分度

　　2.由特定團體的相對標準決定最終成績的測驗是（）

　　A。常模參照測驗

　　B。標準參照測驗

　　C。團體測驗

　　D。個體測驗

　　3.就一個測驗的優劣而言，最為重要的是（）

　　A。效度

　　B。信度

　　C。難度

　　D。區分度

　　4.在實際的教學中，教師通常會在一門課程結束後進行考試或測驗，以評價學生對知識和技能的掌握程度。這種評價方式被稱為（）

　　A。診斷性評價

　　B。配置性評價

　　C。形成性評價

　　D。總結性評價

　　5.在學生學業成績測驗中，有一種適用於大規模範圍內評定個體學業成就水平，用來判斷學生與常模相比時所處水平的測驗被稱為（）

　　A。教師自編測驗

　　B。目標參照測驗

　　C。標準化成就測驗

　　D。定向反映測驗

　　6.為了摸清學生的現有水平及個別差異並便於安排教學，一般在教學開始前使用（）

　　A。診斷性評價

　　B。配置性評價

　　C。形成性評價

　　D。總結性評價

　　7.在一個測驗正式付諸使用以前，測驗的編製者都要建立一個解釋測驗結果的參照指標，使得對分數的解釋更加清晰、明確。這一參照指標指的是（）

　　A。常模

　　B。效度

　　C。難度

　　D。信度

　　8.在布盧姆的教育目標分類中，認知領域的最高目標層次是（）

　　A。知識

　　B。理解

　　C。應用

　　D。評價

　　9.在教育領域，從多種角度以多種方法去評估一個人的知識或能力，以作為教學或輔導效果的證明或依據。這指的是（）

　　A。測驗

　　B。測量

　　C。測評

　　D。評價

　　10.若按測量與評價的對象來劃分，可以將“瑞文推理測驗”歸類於（）

　　A。智力測量與評價

　　B。能力傾向測量與評價

　　C。成就測量與評價

　　D。人格測量與評價

　　11.測量與評價的目的不在測量與評價被試能力的高低，而是要求被試按通常的習慣方式做出反應。這種測量與評價屬於（）

　　A。形成性測量與評價

　　B。常模參照測量與評價

　　C。典型行為測量與評價

　　D。最佳行為測量與評價

　　12.在效標的選擇與效標測量中，應當防止出現（）

　　A。效標汙染

　　B。表麵效度

　　C。內容效度

　　D。結構效度

　　13.測驗給被試或一般人的印象“好像”是在測量某種特質，而不是指測驗事實上能測量到什麽特質。這種效度被稱之為（）

　　A。效標汙染

　　B。表麵效度

　　C。內容效度

　　D。結構效度

　　14.一般來說，教師自編測驗的信度係數至少應該大於（）

　　A。0.2

　　B。0.4

　　C。0.5

　　D。0.6

　　15.經典測驗理論的信度係數主要有三類，下列選項中不正確的是（）

　　A。重測信度

　　B。複本信度

　　C。內部一致性係數

　　D。穩定係數

　　16.分析有價值的活動內涵、歸納出推論的價值概念、建立起個人的內在化價值觀念、發展個人的價值體係、並維持價值體係間的一致性和次序性等能力，這在布盧姆的情感領域中屬於（）

　　A。評價

　　B。內化

　　C。反應

　　D。重組

　　17.測量與評價有診斷學習的作用，下列選項屬於診斷學習作用的是（）

　　A。激勵學生的學習動機

　　B。幫助學生的記憶和促進遷移

　　C。促進學生自我評價

　　D。補救教學

　　18.將項目區別被試水平的能力的量度稱之為（）

　　A。效度

　　B。信度

　　C。難度

　　D。區分度

　　19.1965年，美國測驗專家R。L。Ebel根據長期經驗提出用鑒別指數評價題目性能的標準，並認為評價為優良的區分度值應為（）

　　A。0.40以上

　　B。0.30-0.39

　　C。0.20-0.29

　　D。0.19以下

　　20.試題的實證審查是指通過對獲得的測試數據進行量化分析，以判定試題品質的好壞。實證審查一般不包括試題的（）分析

　　A。難度

　　B。區分度

　　C。信效度

　　D。教學敏感度

　　21.下列選項中不屬於標準化成就測驗優越性的是（）

　　A。客觀性

　　B。計劃性

　　C。可比性

　　D。公開性

　　22.標準化成就測驗是指由專家或學者們所編製的適用於大規模內評定個體的（）測驗。

　　A學業成就水平B。能力形成C。結構D。智力發展

　　23.目前標準化的學業成就測驗與學校課程之間關係（）

　　A。比較緊密

　　B。乏學業效度

　　C。很不協調

　　D。基本協調

　　24.標準化測驗的最新發展趨勢是（）

　　A。常模參照測驗

　　B。計算機適應性測驗

　　C。標準參照測驗

　　D。非正式測驗

　　25.采用智力測驗對某一兒童進行測量，發現在一個月後的測驗結果與六個月前和三個月前的得分大致相等，這表明該智力測驗具有較高的（）

　　A。效度

　　B。信度

　　C。區分度

　　D。相關

　　26.韋氏智力測驗除了有總智商分數，還提供了言語理解、知覺推理、工作記憶和加工速度四個指數。韋氏智力測驗（第4版）的中文版修訂是由我國心理學家（）主持完成的。

　　A。林傳鼎和張厚粲

　　B。林傳鼎

　　C。張厚粲

　　D。陸誌韋

　　27.關於測驗的信度和效度的關係，以下表述不正確的是（）

　　A。信度是效度的必要條件

　　B。效度是信度的充分條件

　　C。高的信度一定有高的效度

　　D。高的效度一定有高的信度

　　28.計算內部一致性係數的主要方法有很多，但不包括（）

　　A。KR20公式

　　B。克龍巴赫α係數

　　C。荷伊特信度

　　D。積差相關係數

　　29.試題的邏輯審查，主要審查試題的適當性和（）

　　A。恰當性

　　B。一致性

　　C。準確性

　　D。合理性

　　30.下列關於教學評價與測量及測驗的關係，說法不正確的是（）

　　A。兩者既有聯係又有區別

　　B。兩者完全等同

　　C。教學評價以測量、測驗的客觀描述為基礎

　　D。測量、測驗的結果通過教學評價才能判斷是否有實際意義

　　二、簡答題

　　1.測量與評價的功能。

　　2.標準化測驗的優點與劣勢。

　　三、判斷分析題

　　1.學生在某學科的期中和期末測驗中，兩次考試所取得的成績前後波動很大，這說明測驗的信度很低。

　　2.凡是以能力的高低作為評價基礎的測量，都屬於最佳行為測量。

　　本章典型過關習題詳解

　　一、單項選擇題

　　1.A“詳解”效度是指測量的正確性和有效性，即一個測驗能夠測量出所要測量的東西的程度。

　　2.A“詳解”該題考查的是常模參照測驗的定義

　　3.A“詳解”一個測驗最重要的是能測量出其想要測量的東西。

　　4.D“詳解”在期末或一門課程結束後進行的考試或評價稱之為總結性評價。

　　5.C“詳解”在學生學業成績測驗中，有一種適用於大規模範圍內評定個體學業成就水平，用來判斷學生與常模相比時所處水平的測驗被稱為標準化成就測驗。

　　6.B“詳解”配置性評價一般在教學開始前使用，且目的是為摸清學生的水平和個體差異並據此安排教學；診斷性評價有時與配置性評價意義相當，但有時指對經常表現學習困難的學生所做的評價。

　　7.A“詳解”一般來說，常模是指測驗時的參照指標，建立在測驗之前。

　　8.D“詳解”布盧姆將認知領域的學習分為知識、理解、應用、分析、綜合、評價六個層次。這六個層次由低到高，每一項都建立在先前獲得的技能基礎之上。

　　9.D“詳解”該題考查的是評價的定義。

　　10.A“詳解”該題四個選項均屬於根據測量與評價的對象進行分類的具體類型。智力測量與評價目的在於測量並評價個人智力水平的高低。包括智力測驗有“斯坦福——比納量表”、“韋克斯勒智力量表”、“瑞文推理測驗”等等。

　　11.C“詳解”典型行為測量與評價的目的不在測量與評價被試能力的高低，而是測量與評價其是否具備某種（或某些）典型行為。即典型行為測量與評價所關心的不是被試能不能盡其所能地表現出其最佳水平，而是要求被試按通常的習慣方式做出反應（即典型行為）。如態度、情感、人格、興趣測量等等，都屬於典型行為測量。這些測量過程，希望被試以其平常的典型狀況來回答，無所謂正確與錯誤之分。

　　12.A“詳解”選擇效標和效標測量時，要注意防止效標汙染，即效標評定受到評定者知道測驗分數的“汙染”。例如，一位老師知道某學生在一個能力傾向測驗上得分很低，這類消息可能會影響他對該學生的成績評定。出於這種原因，“對測驗分數進行檢驗”時，使用的測驗分數必須嚴格保密。

　　13.B“詳解”表麵效度是指測驗給被試或一般人的印象“好像”是在測量某種特質，而不是指測驗事實上能測量到什麽特質。表麵效度的存在，有時可以激勵學生認真作答，表現接受測驗的合作意願，因為它“看起來”像是在測量某種特質，比較容易吸引人注意。但是，表麵效度並不是真正的效度，它不可以用來從內容代表性的角度來檢驗測驗效度。

　　14.D“詳解”一般而言，測驗信度越高越好。教師自編測驗一般來說信度為低一些，但信度係數至少應在0.60以上。

　　15.D“詳解”經典測驗理論的信度係數主要有重測信度、複本信度、內部一致性係數三類，另外，分半信度可以和複本信度一樣解釋，即可以把對等的兩半測驗看成是在最短時距內施測的兩個平行測驗。又由於分半信度描述的是兩半題目間的一致性，所以它有時也被看作是內部一致性係數。

　　16.D“詳解”情感領域的教學目標依次可以分為接受、反應、評價、重組和內化五個層次，該題考查的是重組的定義。

　　17.D“詳解”測量與評價促進學生學習有兩個方麵的作用，一是診斷學習，二是幫助學習。該題的前三個選項都是幫助學習方麵的作用。

　　18.D“詳解”該題考查的是區分度的定義。

　　19.A“詳解”1965年，美國測驗專家R。L。Ebel根據長期經驗提出用鑒別指數評價題目性能的標準為：區分度值0.40以上評價為優良；0.30-0.39評價為合格；0.20-0.29評價為尚可，需修改；0.19以下評價為應淘汰。

　　20.C“詳解”教師命製的題目組成試卷之前，應對試題進行必要的審查，這可以分成兩個方麵來進行：邏輯的審查和實證的審查。實證的審查是指通過對獲得的測試數據進行量化分析，以判定試題品質的好壞。主要包括試題的難度和區分度分析，以及教學敏感度分析。

　　21.D“詳解”標準化測驗的優點主要有客觀性、計劃性和可比性。

　　22.A“詳解”該題考查的是標準化成就測驗的定義。這種測驗的命題、施測、評分和解釋，都有一定的標準或規定。

　　23.C“詳解”對標準化測驗的批評包括兩個，一是與學校課程之間的關係很不協調，二是測驗結果的不當使用，我們通常利用標準化成就和能力測驗對學生分類和貼標簽，對個體造成了不良影響。

　　24.B“詳解”計算機化的適應性測驗是標準化測驗的最新發展趨勢，它是運用最先進的信息技術來改革測驗工具和模式的嚐試。

　　25.B“詳解”信度是指一種測驗多次測量所獲得分數的穩定性、一致性程度，它反映的是測驗的可靠性。題幹中所描述的是前後幾次測驗結果都相當，正符合信度的定義。

　　26.C“詳解”韋氏智力量表是美國韋克斯勒於1955年主持編製的係列智力測驗量表，是目前世界上應用最廣泛的智力測驗量表。該量表於1981年由湖南醫科大學龔耀先教授等主持修訂。林傳鼎和張厚粲在20世紀80年代初主持了韋氏兒童智力測驗中文版（WISKR）的修訂版。張厚粲在2007年主持完成了韋氏智力測驗（第4版）的中文版修訂，量表除了有總智商分數，還提供了言語理解、知覺推理、工作記憶和加工速度四個指數。

　　27.C“詳解”效度和信度是相輔相成的，效度是信度的充分條件，信度是效度的必要條件。效度高的測驗必然具有高信度，但信度高的未必測驗一定有效。總之，一個良好的測驗，必須同時具備高效度和高信度兩個指標。

　　28.D“詳解”內部一致性係數也叫同質性信度，是指測驗內部所有題目間的一致性程度，主要的計算方法有KR20公式、KR21公式、克龍巴赫α係數，以及荷伊特信度等。

　　29.B“詳解”教師命製的題目組成試卷之前，應對試題時行必要的審查，包括邏輯的審查和實證的審查。其中邏輯的審查，主要是審查測驗試題是否具有一致性和適當性，以確保測驗試題都能測量所要測量的教學目標。一致性的重點在於試題是否與教學目標一致、與教學的呈現方式一致、是否能代表所要測驗的行為目標等。

　　30.B“詳解”教學測量與評價兩者既有區別，又有密切的聯係。一方麵，教學測量時對學績測驗所得結果的客觀描述，並不考慮結果的實際意義。而教學評價則是對學績測驗所得結果的主觀判斷（對結果進行解釋），以了解結果的實際意義。另一方麵，雖然教學評價是一種主觀判斷，但是這種主觀判斷必須以教學測量所得的客觀描述為依據，否則就是主觀主義的判斷。同樣，教學測量隻有通過教學評價才能體現這種客觀描述的實際意義。

　　二、簡答題

　　1.測量與評價的功能。

　　“答案要點”

　　①提供反饋；②提供信息；③激勵學生；④衡量教學效果。

　　2.標準化測驗的優點與劣勢。

　　“答案要點”

　　（1）標準化測驗的優點。

　　①客觀性；②計劃性；③可比性。

　　（2）標準化測驗的劣勢。

　　①不能促進學習；②使用條件非常嚴格，難以預測個體情況；③未必真正公平。

　　三、判斷分析題

　　“答案要點”

　　1.錯誤。信度定義所指的是針對同一批被試參與同一套測試題而言的，期中和期末兩次考試在現有的學校教育體係中，一般不太可能考同一套試題，因此與信度關係不大。

　　2.正確。以測量與評價對被試行為表現的要求來分類，可以將測量與評價分為最佳行為測量和典型行為測量。其中最佳行為測量是以測量被試的最佳行為表現為目的的，而典型行為測量的目的是測量與評價被試是否具備某種或某些典型行為。因此，凡是以能力的高低作為評價基礎的，都屬於最佳行為測量與評價。

　　

更多 編輯推薦: 1中國股民、基民常備手冊; 2拿起來就放不下的60...; 3青少年不可不知的10...; 4章澤; 5周秦漢唐文明簡本; 6從日記到作文; 7西安古鎮; 8共產國際和中國革命的關係; 9曆史上最具影響力的倫...; 10西安文物考古研究（下）

看過本書的人還看過

西安文物考古研究上）

作者：西安文物保護考古所　

科普教育 【已完結】

本書共收入論文41篇，分7個欄目，即考古學探索、文物研究、古史探微、遺址調查報告、地方史研究、文物保護修複技術、文物管理工作。
浙江抗戰損失初步研究

作者：袁成毅　

科普教育 【已完結】

Preface Scholars could wish that American students and the public at large were more familiar...
中國古代皇家禮儀

作者：孫福喜　

科普教育 【已完結】

本書內容包括尊君肅臣話朝儀；演軍用兵禮儀；尊長敬老禮儀；尊崇備至的皇親國戚禮儀；任官禮儀；交聘禮儀等十個部分。
中國古代喪葬習俗

作者：周蘇平　

科普教育 【已完結】

該書勾勒了古代喪葬習俗的主要內容，包括繁縟的喪儀、喪服與守孝、追悼亡靈的祭祀、等級鮮明的墓葬製度、形形色色的安葬方式等九部分內容。