下面我們來(lái)看2015年考研:心理學(xué)測(cè)量筆記(9)
第四章 心理測(cè)量的誤差
前面我們已經(jīng)討論了什么是測(cè)驗(yàn),以及如何編制測(cè)驗(yàn),現(xiàn)在轉(zhuǎn)入研究什么是一個(gè)好的測(cè)驗(yàn)。
無(wú)論何種測(cè)量工具,我們對(duì)它起碼的要求是穩(wěn)定,準(zhǔn)確。用心理測(cè)量學(xué)的術(shù)語(yǔ)來(lái)說(shuō),就是要可信和有效。所謂可信是指多次測(cè)量的結(jié)果是一致的,所謂有效是指正確地測(cè)量了所要測(cè)的東西。信度是測(cè)量一致性程度的估計(jì),效度是測(cè)量準(zhǔn)確性程度的估計(jì)。
關(guān)于測(cè)量的信度和效度問(wèn)題,下邊有專章分別討論。為了考察測(cè)量的信度和效度,首先要了解測(cè)量的誤差。
第二節(jié) 誤差的來(lái)源
一個(gè)測(cè)驗(yàn)要準(zhǔn)確可靠,必須控制各種誤差,為此首先要了解誤差的來(lái)源。
根據(jù)誤差定義,任何變因只要與測(cè)量目的無(wú)關(guān),并使得結(jié)果不準(zhǔn)確、不一致,便可認(rèn)為是一種誤差因素。在心理測(cè)量中,
常見(jiàn)的誤差來(lái)源于三個(gè)方面:測(cè)驗(yàn)內(nèi)部,施測(cè)過(guò)程,受測(cè)者本身。
一、測(cè)驗(yàn)內(nèi)部引起的誤差
測(cè)驗(yàn)內(nèi)部的誤差主要來(lái)源于題目取樣:當(dāng)測(cè)驗(yàn)題目較少或取樣缺乏代表性時(shí),被試的反應(yīng)受機(jī)遇影響較大,(譬如一次考試碰巧準(zhǔn)備到或沒(méi)準(zhǔn)備到某題),當(dāng)幾個(gè)測(cè)驗(yàn)復(fù)本不等值時(shí),接受不同的題目,就會(huì)獲得不同的分?jǐn)?shù)。
除題目取樣不當(dāng)可引起誤差外,其它一些因素,如題目用詞的模棱兩可,對(duì)反應(yīng)步驟說(shuō)得不清,題目過(guò)難引起猜測(cè),時(shí)限短使被試倉(cāng)促作答等,也都可能成為誤差的來(lái)源。
二、由施測(cè)過(guò)程引起的誤差
在三種誤差來(lái)源中,與施測(cè)過(guò)程有關(guān)的誤差可能是最容易控制和檢驗(yàn)的。通過(guò)長(zhǎng)期實(shí)踐,測(cè)驗(yàn)的標(biāo)準(zhǔn)化水平越來(lái)越高,大部分施測(cè)條件能夠得到控制。但由于心理現(xiàn)象的復(fù)雜性,許多意想不到的偶然因素仍可能影響測(cè)驗(yàn)分?jǐn)?shù),使人防不勝防。
(一)物理環(huán)境
施測(cè)現(xiàn)場(chǎng)的溫度。光線,聲音、桌面好壞,空間闊窄等皆具有影響。
(二)主試者方面:
主試者的年齡、性別、外表,施測(cè)時(shí)的言談舉止、表情動(dòng)作等均能影響測(cè)驗(yàn)結(jié)果。倘若不按照規(guī)定實(shí)施測(cè)驗(yàn),如制造緊張氣氛,給予特別協(xié)助或暗示,以及計(jì)時(shí)錯(cuò)誤等,都會(huì)帶來(lái)較大誤差,特別是當(dāng)測(cè)驗(yàn)具有復(fù)雜步驟和說(shuō)明,或測(cè)驗(yàn)題本身是模糊不確定的形式時(shí),當(dāng)主試者在安排測(cè)驗(yàn)條件上有較多余地(例如個(gè)別施測(cè))時(shí),當(dāng)測(cè)驗(yàn)是對(duì)幼兒,有情緒困擾者以及對(duì)測(cè)驗(yàn)程序不熟悉的人施測(cè)時(shí),主試者的影響更大。
(三)意外干擾:
在測(cè)驗(yàn)環(huán)境復(fù)雜,特別是當(dāng)受試人數(shù)較多時(shí),容易發(fā)生出乎預(yù)料的干擾或分心事件。例如:停電、有人生病,有人作弊,計(jì)價(jià)表停了、臨時(shí)發(fā)現(xiàn)題目或作答紙印刷不清或裝訂錯(cuò)誤等,無(wú)論哪種情況都會(huì)引起不安和擾亂,導(dǎo)致成績(jī)不準(zhǔn)確、不一致。
(四)評(píng)分計(jì)分,
評(píng)分不客觀以及計(jì)算登記分?jǐn)?shù)出錯(cuò)等也是常見(jiàn)的誤差。一般選擇題的評(píng)分較為客觀。而問(wèn)答題、論文題等自由反應(yīng)型的題目,評(píng)分標(biāo)準(zhǔn)很難掌握,加之閱卷者的偏好各不相同,因而難以保證分?jǐn)?shù)的一致性.
早在幾十年前,國(guó)外就有人對(duì)舊法考試的評(píng)分誤差做過(guò)研究。斯達(dá)奇(D•storch)和埃立奧特(E•C•Elliott)將一份英文考卷請(qǐng)142位英文教員評(píng)閱,所得分?jǐn)?shù)從50分到98分應(yīng)有盡有。某國(guó)教育界還有一件引為笑談的事,1920年夏季,許多大學(xué)教授在評(píng)閱歷史試卷時(shí),有一位教授為評(píng)分便利起見(jiàn),自己寫(xiě)了一份標(biāo)準(zhǔn)答案,不料和其它考卷混在一起,經(jīng)另一位教授評(píng)閱竟然不及格。為慎重起見(jiàn),由其它教授重復(fù)評(píng)定,結(jié)果所得分?jǐn)?shù)以10分到90分不等。1961年美國(guó)教育測(cè)驗(yàn)中心由53個(gè)評(píng)判員組成專門小組。對(duì)大學(xué)一年級(jí)學(xué)生寫(xiě)的200篇作文按九個(gè)等級(jí)評(píng)分,結(jié)果有1/3的文章得到了九個(gè)等級(jí),有60%的文章得到了七個(gè)或八個(gè)等級(jí),沒(méi)有一篇文章少于五個(gè)等級(jí)。一般理科評(píng)分要比文科客觀些,但也不盡然。羅雪(Ruch)將—道地理題的解答請(qǐng)91位教員評(píng)閱,滿分為20分,結(jié)果給17種分?jǐn)?shù),全距為2—20,給各種分?jǐn)?shù)的人次見(jiàn)表4—1,斯達(dá)奇和埃立奧特將一份幾何考卷請(qǐng)115位中學(xué)教員評(píng)立,所得分?jǐn)?shù)為28—92分,全距60多分。
表4—1 91位教師對(duì)于一個(gè)地理題的回答所給分?jǐn)?shù)的分布
分?jǐn)?shù) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
人次 | 0 | 0 | 1 | 2 | 0 | 1 | 4 | 3 | 7 | 5 | 24 | 5 | 14 | 8 | 2 | 10 | 2 | 1 | 1 | 0 | 1 |
考研視頻題庫(kù)【手機(jī)題庫(kù)】 | 搜索公眾微信號(hào)"566考研"
相關(guān)推薦:
2015考研西醫(yī)綜合 如何應(yīng)對(duì)大綱變化