第三節(jié)測(cè)驗(yàn)的信度
第一單元信度的概念
第二單元信度評(píng)估的方法
第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋
第四單元影響信度的因素
第一單元信度的概念
一、信度的定義
信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。
在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與總方差(實(shí)得分?jǐn)?shù)的方差)的比率。
二、信度的指標(biāo)
(一)信度系數(shù)與信度指數(shù)
信度指數(shù)是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比值。
信度指數(shù)的平方就是信度系數(shù)。
(二)測(cè)量標(biāo)準(zhǔn)誤
測(cè)量誤差分布的標(biāo)準(zhǔn)差,即為測(cè)量的標(biāo)準(zhǔn)誤。
第二單元信度評(píng)估的方法
一、重測(cè)信度
二、復(fù)本信度
三、內(nèi)部一致性信度
四、評(píng)分者信度
信度的類型與估計(jì)方法
重測(cè)信度(test-retestreliability)
又稱穩(wěn)定性系數(shù)。它的計(jì)算方法是采用重測(cè)法,即使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試者前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。最適宜的時(shí)距隨測(cè)驗(yàn)的目的、性質(zhì)和被試特點(diǎn)而異,一般是兩周到四周較宜,間隔時(shí)間最長不超過六個(gè)月。
內(nèi)部一致性信度(internalconsistencyreliability)
–分半信度(split-halfreliability)
是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。
分半法經(jīng)常會(huì)低估信度,必須修正,借以估計(jì)整個(gè)測(cè)驗(yàn)的信度。
–同質(zhì)性信度(homogeneityreliability)
同質(zhì)性主要代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,則測(cè)驗(yàn)為同質(zhì)的。相反,即使所有題目看起來好象測(cè)量同一特質(zhì),但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí),則測(cè)驗(yàn)為異質(zhì)的。
–評(píng)分者信度(scorerreliability)
–隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。
–一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。
–當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象,并以等級(jí)法記分時(shí),可采用肯德爾和諧系數(shù)作為評(píng)分者信度的估計(jì)。
第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋
一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)
二、確定信度可以接受的水平
三、解釋個(gè)人分?jǐn)?shù)的意義
四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異
信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋本文來源:中大網(wǎng)校網(wǎng)
解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)
信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。
確定信度可以接受的水平
當(dāng)rxx<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較;當(dāng)rxx≥0.85時(shí),才能用來鑒別或預(yù)測(cè)個(gè)人成績或作為。
解釋個(gè)人分?jǐn)?shù)的意義
–其一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;其二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。這就是測(cè)量標(biāo)準(zhǔn)誤的應(yīng)用。
比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異
這種比較包括兩個(gè)人不同分?jǐn)?shù)的差別和同一被試在兩個(gè)測(cè)驗(yàn)上的差別。這就是差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤問題
第四單元影響信度的因素
一、樣本特征
(一)樣本團(tuán)體異質(zhì)性的影響
(二)樣本團(tuán)體平均能力水平的影響
二、測(cè)驗(yàn)長度
(一)測(cè)驗(yàn)越長測(cè)題取樣或內(nèi)容取樣越有代表性。
(二)測(cè)驗(yàn)越長被試的猜測(cè)因素影響就越小。
三、測(cè)驗(yàn)難度
難度與信度不存在簡單的對(duì)應(yīng)關(guān)系。如果因?yàn)殡y度過大或過小,造成分?jǐn)?shù)范圍縮小,可使信度降低。
四、時(shí)間間隔
再測(cè)法求信度,間隔時(shí)間越短信度系數(shù)越大;間隔時(shí)間越久,信度系數(shù)越低。
注意:
斯皮爾曼-布朗公式為校正分半信度的經(jīng)驗(yàn)公式,它的假設(shè)是兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)假設(shè)不成立時(shí),可用下列兩種公式之一,直接求得測(cè)驗(yàn)的信度系數(shù)。
弗朗那根(flanagan)公式,盧倫(kulon)公式
對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測(cè)驗(yàn)是不行的,因而常常采用若干相對(duì)異質(zhì)的分測(cè)驗(yàn),使每個(gè)分測(cè)驗(yàn)內(nèi)容具有同質(zhì)性。
相關(guān)鏈接:
·2010年心理咨詢師考前網(wǎng)上輔導(dǎo)招生簡章
更多信息請(qǐng)?jiān)L問:心理咨詢師頻道 心理咨詢師考試論壇
(責(zé)任編輯:)