>>2013教師資格考試中學教育心理學考點命題章節(jié)匯總
第二節(jié) 教學測量與評價的方法和技術
與教學目標相一致,教學評價也應包括認知、情感和技能三個方面。對于認知和技能領域的學業(yè)成就,最常用的教學評價手段是標準化成就測驗和教師自編測驗。而對于情感以及道德行為表現(xiàn)則常常采用非測驗性的評價手段,如案卷分析、觀察、問卷量表以及談話等。當然,這些非測驗性的評價手段也可作為學業(yè)成就評價的補充。
一、標準化成就測驗
(一)標準化成就測驗的含義及特點
標準化成就測驗是指由專家或?qū)W者們所編制的適用于大規(guī)模范圍內(nèi)評定個體學業(yè)成就水平的測驗。這種測驗的命題、施測、評分和解釋,都有一定的標準或規(guī)定。由于測驗條件的標準化,測驗的結果比較客觀一致,適用的范圍和時限也較寬廣。其特點大致為:測驗是由專門機構或?qū)<覍W者按一定測驗理論和技術,根據(jù)全國或某一地區(qū)所有學校的共同教育目標來編制的。所有受試人所做的試題、時限等施測條件相同,計分手段和分數(shù)的解釋也完全相同。
(二)標準化成就測驗的優(yōu)越性
第一,客觀性。在大多數(shù)情境下,標準化測驗是一種比教師發(fā)展出的測驗更加客觀的測量工具。第二,計劃性。專家在編制標準化測驗時,已經(jīng)考慮到所需的時間和經(jīng)費,因此標準化測驗比大部分的課堂測驗更有計劃性。第三,可比性。標準化測驗由于具有統(tǒng)一的參照標準,使得不同考試者的分數(shù)具有可比性。
(三)標準化測驗的局限性
第一,與學校課程之間的關系很不協(xié)調(diào)。在我國,每個地區(qū)的教學狀況還存在著一定的差距,一個年級或地區(qū)的教學內(nèi)容可能不同于另一個地區(qū)。因此,可能不少地區(qū)學生所學到的內(nèi)容與標準化樣本所學的東西有差異。這就要求教師在選用標準化測驗前,仔細查閱內(nèi)容效度,使得測驗的目標與評價的目的相匹配。第二,測驗結果的不當使用,我們通常利用標準化成就和能力測驗對學生分類和貼標簽,對個體造成了不良影響。它們的使用對得低分的學生傷害尤大。
二、教師自編測驗
(一)自編測驗的含義與特點
教師自編測驗是由教師根據(jù)具體的教學目標、教材內(nèi)容和測驗目的,自己編制的測驗,是為特定的教學服務的。教師自編測驗通常用于測量學生的學習狀況,而標準化成就測驗則用來判斷學生與常模相比時所處的水平。
(二)測驗前的計劃
第一,確定測驗的目的。
第二,確定測驗要考查的學習結果。
第三,列出測驗要包括的課程內(nèi)容。
第四,寫下考試計劃或細目表。細目表是將考試具體化的最重要的工具,使得測驗能夠與教學的目標和內(nèi)容保持一致。細目表的形式是兩維表,一般縱欄表示學習結果,橫欄表示課程的內(nèi)容或范圍。中間的欄目,就是教師根據(jù)自己的情況填上在測驗中計劃測量多大比例的學習結果和課程內(nèi)容。
第五,針對計劃測量的學習結果,選擇適合的題型。自編測驗包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗的目的、內(nèi)容和時間決定的。一般來說,由于這兩種題型各有優(yōu)點和不足,最好加以綜合使用。
(三)自編測驗的類型
1.客觀題
客觀題具有良好的結構,對學生的反應限制較多。學生的回答只有對、錯之分,因此教師評分也就只可能是得分或失分。這類題目包括選擇題、是非題、匹配題和填空題等。
(1)選擇題。選擇題是由題干和兩個或更多的選項組成的。題干可以是直接提問或者以不完整的名字形式出現(xiàn),目的是為了設置問題情境。而選項則提供可供選擇的答案,包括一個正確答案和若干具有干擾性的錯誤項或迷惑項。學生的任務就是閱讀題目,再從一系列選項中挑選出正確的項目。
教師在出題時,要綜合考慮題干和選項,使整個題目清楚明了。選項的數(shù)量一般沒有統(tǒng)一的規(guī)定,教師可以隨意確定選項的個數(shù),大多是4~5個,這樣可避免學生猜測答案。所有的題目也可以安排各自不同數(shù)量的選項。良好的選擇題,題干應該明確簡單,而選項又深具迷惑性。
經(jīng)過精心設計的題干和選項,可以測查目標系列中的高于知識水平的任何等級。此外,選擇題還有一種常用變式,選項中有一至多個正確答案,即通常被稱為多選題。這種題型的難度大大高于常規(guī)的選擇題(單選題),可以有效地檢查高一級的學習成果,在測驗中使用較廣。
(2)是非題。是非題與選擇題有一點相似之處,就是學生需要識別、選擇出正確答案。常用的形式是,陳述一句話要求學生判斷對錯或是非。是非題可用于測量不同水平的教學目標。
是非題形式簡單,能夠在一份試卷內(nèi)覆蓋大量的內(nèi)容。教師在評判時也較客觀,計分簡便省時。但是,一個重要的問題是:學生只有兩種選擇——對或錯,所以即使在完全猜測的情況下,他們也有50%的機會選擇到正確答案。一種可行的辦法是,增加題目的數(shù)量。由于題量大,對題目總體的取樣較全面,學生很難只憑猜測獲得高分。
(3)匹配題。匹配題是另一種可提供多種選擇的考試形式。通常,題目包括兩列詞句,一列是問題選項,一列是反應選項。學生根據(jù)題意按照某種關系將左右的項目連接起來。匹配題形式簡單,能夠有效地測量學生對知識聯(lián)系的掌握情況,且易于計分。但是,它只能用于測查彼此存在著簡單關系的知識。
(4)填空題。填空題是呈現(xiàn)給學生一句或一段不完整的話或者直接提問,要求學生簡要做答。當教師的目的是考查學生對知識的回憶時,填空題十分有用,它可將學生猜測的可能性降到最小。如果經(jīng)過精心設計,也可以通過填空題來考查學生對知識的記憶和理解,以及推理和判斷能力。填空題的問題在于,學生的答案各不相同甚至還會出現(xiàn)出人意料的答案,學生的答案還會受筆跡、用詞等無關因素的影響。
2.主觀題
主觀題則要求學生自己組織材料,并采用合適的方式表達陳述出來。這類題型包括論文題及問題解決題。教師在評分時,對學生的回答需要給出不同量的分值,而不僅僅是滿分或零分。
(1)論文題。論文題是指要求學生用文字論述方式闡述相關觀點的題目,回答字數(shù)可以從幾段到幾大頁不等。一般較常使用的有兩種類型,有限制的問答題和開放式論文。有限制的問答題,是指教師對回答的內(nèi)容和長度都有規(guī)定,如平時測驗中的簡答題等。例如,說明戊戌政變中的重要人物、事情經(jīng)過以及結果。開放式論文,則允許學生在內(nèi)容上可以自由選材、自由發(fā)揮,而且篇幅較長。論文題可以測驗知識、理解或運用水平,也可考查學生的分析、綜合、類比和評估知識的能力,還可考查學生組織信息或表達陳述某項意見的能力。
使用論文題也有不妥之處。首先,學生回答論文題需要花費很多時間。因此,在一份試卷里只能出現(xiàn)少量的題目,對課程內(nèi)容的取樣也就非常有限。通過增加小的論文題(即簡答題或問答題),可以避免這個問題。其次,對于熟悉自己學生的教師,在判卷時很難做到客觀,導致信度較低。在評分時,經(jīng)常出現(xiàn)一種現(xiàn)象一一暈輪效應,即教師對學生的總體印象影響到對論文題目的評價。因為平時的接觸或者前面幾道題解答的情況,使得教師對學生形成了某種印象,從而影響到對之后題目的評判。
(2)問題解決題。問題解決題是向?qū)W生提供一定的問題情境和目標情境,要求學生通過對知識進行組織、選擇和運用等復雜的程序來解決問題。通常有兩種形式,一種是間接測驗,與前面提到的幾種測驗形式一樣,是采用紙筆測驗來評價學生的學業(yè)成就或能力。學生在完成時,通常必須寫出若干步驟或過程,以展現(xiàn)他的思路。評分時,按照步驟計分,如果缺少某些步驟就不能得分。平時的理科考試多出這種類型的問題解決題。
問題解決題的另一種方式則是直接測驗。例如,為了考查學生學習本節(jié)內(nèi)容的情況,讓學生編制一份測驗小學兩步應用題的測題。由于它考查了學生處理實際問題的能力,所以有時我們又把這種形式叫做操作評價。教師可以要求學生設想一個可以解決學校垃圾處理問題的方案(要求只寫可行性措施,不超過500字),或者要求學生測量學校操場的面積。操作評價對于考查高級思維技能十分有效,但是往往費時費錢,而且主觀性較大,并且效度也經(jīng)常受到質(zhì)疑。
(四)有效自編測驗的特征
1.信度
信度是指測驗的可靠性,即多次測驗分數(shù)的穩(wěn)定、一致的程度。它既包括在時間上的一致性,也包括內(nèi)容和不同評分者之間的一致性。例如,采用性格量表測量學生,他們在這一個月的結果,如果大致等于六個月前和三個月前的得分,那么我們就認為測驗
的信度較高。
2.效度
效度是指測量的準確性,即一個測驗能夠測量出其所要測量的東西的程度。效度是一個相對概念,任何一種測量工具只是對一定的目的來說才是有效的。效度考慮的問題是:測驗測量什么?測驗對測量目標的測量精確性和真實性有多大?效度的重要性大于信度,因為一個低效度的測驗,即使具有很好的信度,也不能獲得有用的資料。例如,用磅秤稱量體重,連續(xù)多次都會得到相同的值,而且準確地反映了個體的重量,那么信度和效度都很高;但是如果使用它來測量身高,雖然測量值之問總是保持一致的,即信度很好,但是并沒有說明個體的高度,因而不是適宜的測量身高的工具。
3.區(qū)分度
區(qū)分度是指測驗項目對所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學生對測驗項目的反應與某種參照標準之間的關系來估計的。例如,可用年級或教師評定的等級作標準,看測驗的項目能否把不同年級或不同水平的學生區(qū)分開來。
(五)自編測驗的常見錯誤
第一,教師過于相信自己的主觀判斷而忽視測驗的信度和效度指標。
第二,許多教師對測驗準備的重要性缺乏足夠的認識,對測驗準備不夠充分,甚至沒有準備。
第三,許多教師編制的測驗太簡單,題量太小。
總之,測驗準備不充分、題量小、相信主觀判斷,都會導致過分強調(diào)無關細節(jié),從而忽略本章提到的那些重要的原則或注意事項。
三、非測驗的評價技術
在實際教育中,前述紙筆測驗并不是收集資料的唯一途徑。教師還使用了許多非測驗的評價技術,尤其是情感領域的教學評價更需要采用非紙筆測驗。情感教學不屬于任何一個學科,其效果可能產(chǎn)生在任何一種認知學科的教學過程中。
(一)案卷分析
案卷分析是一種常用的評價策略,其內(nèi)容主要是按照一定標準收集起來的學生認知活動的成果。例如,學生的家庭作業(yè)或課堂練習、論文、日記、手工制作的模型、繪畫等各種作品。對學生的作品進行考察分析,并形成某種判斷和決策的過程就是案卷分析。
(二)觀察
通過教學過程中的非正式觀察,教師也能夠搜集到大量的關于學生學業(yè)成就的信息。這種觀察不只限于智能的發(fā)展,還包括學生生理、社會和情緒的發(fā)展。為了確保觀察的有效性,教師應注意自然地對學生進行全面系統(tǒng)的觀察,然后客觀、詳細地記錄下觀察信息。
1.行為檢查單
教師可以使用檢查單來記錄其在教學中的觀察結果。檢查單一般包括一系列教師認為重要的目標行為,通常采用有/無的方式記錄,但有時也記錄下次數(shù)。行為檢查單使用簡便易行,對于教師非常有用。尤其在課堂上,教師可以利用檢查單及時記下所觀察到的行為,便于指導和幫助學生。如果行為是屬于某一個好一壞連續(xù)體上的某一點,那么更適宜的方式是等級評價量表。當觀察目標是具體、特定的經(jīng)過了明確界定的行為時,檢查單非常有效。
2.軼事記錄
軼事記錄是描述所觀察的事件。與檢查單相比,軼事記錄可提供比較詳細的信息,這些記錄一般是按照發(fā)生時間排列的。教師可以在事先有明確的觀察目標,就某一方面的行為進行記錄;也可以沒有明確目的,事后再專門分析或考查某一件事,這時教師就需要記下很多資料,甚至包括一些無關信息。軼事記錄要求教師純粹記載下所觀察到的內(nèi)容,而不要摻雜進個人的意見或觀點。許多教師在他們的教案或工作日記上,都有軼事記錄。但是,軼事記錄比較費時,而且也很難排除主觀偏見。
3.等級評價量表
等級評價量表對于連續(xù)性的行為,可能更為有效。它可用于判斷某種行為的發(fā)生頻率,以及某種操作或活動的質(zhì)量,使得觀察信息被量化。評價量表是一種間接的觀察技術,通過量化所觀察的信息,可以迅速簡便地獲得概括化的信息。評價量表和行為檢查單有一定關系。二者都要求教師對學生的行為進行判斷,可以在觀察過程中或結束后使用。但是它們的評價標準不同,檢查單只需要做定性的判斷,而等級評價量表是做定量的判斷。
(三)情感評價
許多時候,教師有必要針對學生的情緒、學習動機、個人觀點等進行評價。固然,我們可以借助已有的量表,但是學校也鼓勵教師自己編制評價量表。為了獲得這類信息,教師可以自行編寫開放式問題、問卷等。而在對結果的評價時,教師也需要寫一份詳細的報告,形式類似于上文的觀察報告。
四、教學評價結果的處理與報告
(一)評分
評分時必須以一定的比較標準為依據(jù),評分的標準可分為絕對標準和相對標準兩種。絕對標準是以學生所學的課程內(nèi)容為依據(jù),學生的分數(shù)和其他同學的回答情況沒有關系。而且絕對標準強調(diào),由于不同學生的學習起點和背景情況的差異,所以他們的學習結果也是不可比較的。它對應的評價方式,是標準參照評價。相對標準是以其他學生的成績?yōu)橐罁?jù),對應于常模參照評價。相對標準的評價不僅與學生自己的成績有關,還與其他同學的成績有關。
在評分過程中,常常存在計分主觀性問題,教師往往會受一些無關因素的影響,使得評分的信度較低。因此,評分標準一定要與測驗的編制計劃和實際的編制工作保持連續(xù)性,確保整個評價活動是根據(jù)統(tǒng)一的標準進行的。這樣,評價結果才可能是教師所預期的信息,具有較高的信度,能夠?qū)虒W活動發(fā)揮積極作用。
合理的評分過程應包括如下步驟:第一,搜集有關學生的信息,信息可以來源于不同類型、性質(zhì)的測驗,甚至觀察的評價方式。例如,教師對學生期末學習成績的評價,通常是期末考試成績占70%,平時作業(yè)和考試成績占20%,課堂表現(xiàn)占10%。第二,系統(tǒng)地記錄下評價的結果,并隨時保持最新的結果。第三,盡量將搜集的資料量化,用數(shù)據(jù)來表示學生的學習情況。第四,為了把評價的重點放在最終的學習成就,教師需要加大最后測驗得分的權重。第五,評價應該以成就為依據(jù),而其他特征的評價,不要和成就的評價混雜起來。
(二)合格與不合格
有些課程采用合格與不合格來評價學生的成就。教師可以根據(jù)學生是否完成了每次作業(yè)來評價,也有可能根據(jù)學生的幾次作業(yè)情況評分,甚至評分的標準可以是學生的出勤情況。
(三)其他報告方式
除了常用的評分方法,教師還可以使用其他方式來報告評價結果。教師寫學生的個人鑒定或定期的綜合評價,提供給家長和學生。觀察報告也是一種報告評價結果的形式。此外,通過與家長面談,也可以交流關于學生的學習、行為和態(tài)度等方面的資料。
相關推薦:
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |