中大網(wǎng)校

第二節(jié) 教學(xué)測量與評(píng)價(jià)的方法和技術(shù)

教學(xué)評(píng)價(jià)包括認(rèn)知、情感和技能三個(gè)方面。對(duì)于認(rèn)知和技能領(lǐng)域的學(xué)業(yè)成就，最常用的教學(xué)評(píng)價(jià)手段是標(biāo)準(zhǔn)化成就測驗(yàn)和教師自編測驗(yàn)。而對(duì)于情感以及道德行為表現(xiàn)則常常采用非測驗(yàn)性的評(píng)價(jià)手段，如案卷分析、觀察、問卷量表以及談話等。這些非測驗(yàn)性的評(píng)價(jià)手段也可作為學(xué)業(yè)成就評(píng)價(jià)的補(bǔ)充。

一、標(biāo)準(zhǔn)化成就測驗(yàn)

（一）標(biāo)準(zhǔn)化成就測驗(yàn)的含義及特點(diǎn)

標(biāo)準(zhǔn)化成就測驗(yàn)是指由專家或?qū)W者們所編制的適用于大規(guī)模范圍內(nèi)評(píng)定個(gè)體學(xué)業(yè)成就水平的測驗(yàn)。

其特點(diǎn)大致為：測驗(yàn)是由專門機(jī)構(gòu)或?qū)＜覍W(xué)者按一定測驗(yàn)理論和技術(shù)，根據(jù)全國或某一地區(qū)所有學(xué)校的共同教育目標(biāo)來編制的。所有受試人所做的試題、時(shí)限等施測條件相同，計(jì)分手段和分?jǐn)?shù)的解釋也完全相同。

（二）標(biāo)準(zhǔn)化成就測驗(yàn)的優(yōu)越性

第一，客觀性。在大多數(shù)情境下，標(biāo)準(zhǔn)化測驗(yàn)是一種比教師發(fā)展出的測驗(yàn)更加客觀的測量工具。

第二，計(jì)劃性。專家在編制標(biāo)準(zhǔn)化測驗(yàn)時(shí)，已經(jīng)考慮到所需的時(shí)間和經(jīng)費(fèi)，因此標(biāo)準(zhǔn)化測驗(yàn)比大部分的課堂測驗(yàn)更有計(jì)劃性。

第三，可比性。標(biāo)準(zhǔn)化測驗(yàn)由于具有統(tǒng)一的參照標(biāo)準(zhǔn)，使得不同考試的分?jǐn)?shù)具有可比性。

標(biāo)準(zhǔn)化測驗(yàn)的局限性：

第一，與學(xué)校課程之間的關(guān)系很不協(xié)調(diào)。

第二，測驗(yàn)結(jié)果的不當(dāng)使用，我們通常利用標(biāo)準(zhǔn)化成就和能力測驗(yàn)對(duì)學(xué)生分

類和貼標(biāo)簽，對(duì)個(gè)體造成了不良影響。它們的使用對(duì)得低分的學(xué)生傷害尤大。

二、教師自編測驗(yàn)

(一)自編測驗(yàn)的含義與特點(diǎn)

教師自編測驗(yàn)是由教師根據(jù)具體的教學(xué)目標(biāo)、教材內(nèi)容和測驗(yàn)?zāi)康?，自己編制的測驗(yàn)，是為特定的教學(xué)服務(wù)的。教師自編測驗(yàn)通常用于測量學(xué)生的學(xué)習(xí)狀況，而標(biāo)準(zhǔn)化成就測驗(yàn)則用來判斷學(xué)生與常模相比時(shí)所處的水平。

(二)測驗(yàn)前的計(jì)劃

1．確定測驗(yàn)的目的。

2．確定測驗(yàn)要考查的學(xué)習(xí)結(jié)果。

3．列出測驗(yàn)要包括的課程內(nèi)容。

4．寫下考試計(jì)劃或細(xì)目表。細(xì)目表是將考試具體化的最重要的工具，使得測驗(yàn)?zāi)軌蚺c教學(xué)的目標(biāo)和內(nèi)容保持一致。細(xì)目表的形式是兩維表，一般縱欄表示學(xué)習(xí)結(jié)果，橫欄表示課程的內(nèi)容或范圍。中間的欄目，就是教師根據(jù)自己的情況填上在測驗(yàn)中計(jì)劃測量多大比例的學(xué)習(xí)結(jié)果和課程內(nèi)容。

5．針對(duì)計(jì)劃測量的學(xué)習(xí)結(jié)果，選擇適合的題型。自編測驗(yàn)包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗(yàn)的目的、內(nèi)容和時(shí)間決定的。一般來說，由于這兩種題型各有優(yōu)點(diǎn)和不足，最好加以綜合使用。

(三)自編測驗(yàn)的類型

1．客觀題

客觀題具有良好的結(jié)構(gòu)，對(duì)學(xué)生的反應(yīng)限制較多。學(xué)生的回答只有對(duì)、錯(cuò)之分，因此教師評(píng)分也就只可能是得分或失分。這類題目包括選擇題、是非題、匹配題和填空題等。

(1)選擇題。選擇題是由題干和兩個(gè)或更多的選項(xiàng)組成的。題干可以是直接提問或者以不完整的句子的形式出現(xiàn)，目的是為了設(shè)置問題情境。而選項(xiàng)則提供可供選擇的答案，包括一個(gè)正確答案和若干具有干擾性的錯(cuò)誤項(xiàng)或迷惑項(xiàng)。學(xué)生的任務(wù)就是閱讀題目，再從一系列選項(xiàng)中挑選出正確的項(xiàng)目。

此外，選擇題還有一種常用變式，選項(xiàng)中有一至多個(gè)正確答案，即通常被稱為多選題。這種題型的難度大大高于常規(guī)的選擇題（單選題），可以有效地檢查高一級(jí)的學(xué)習(xí)成果，在測驗(yàn)中使用得較廣。

(2)是非題。是非題與選擇題有一點(diǎn)相似之處，學(xué)生需要識(shí)別、選擇出正確答案。常用的形式是，陳述一句話要求學(xué)生判斷對(duì)錯(cuò)或是非。是非題可用于測量不同水平的教學(xué)目標(biāo)。

是非題形式簡單，能夠在一份試卷內(nèi)覆蓋大量的內(nèi)容。教師在評(píng)判時(shí)也較客觀，計(jì)分簡便省時(shí)。但是，一個(gè)重要的問題是：學(xué)生只有兩種選擇——對(duì)或錯(cuò)，所以即使在完全猜測的情況下，他們也有50%的機(jī)會(huì)選擇到正確答案。一種可行的辦法是，增加題目的數(shù)量。由于題量大，對(duì)題目總體的取樣較全面，學(xué)生很難只憑猜測獲得高分。

(3)匹配題。匹配題是另一種可提供多種選擇的考試形式。通常，題目包括兩列詞句，一列是問題選項(xiàng)，一列是反應(yīng)選項(xiàng)。學(xué)生根據(jù)題意按照某種關(guān)系將左右的項(xiàng)目連接起來。匹配題形式簡單，能夠有效地測量學(xué)生對(duì)知識(shí)聯(lián)系的掌握情況，且易于計(jì)分。但是，它只能用于測查彼此存在著簡單關(guān)系的知識(shí)。

(4)填空題。填空題是呈現(xiàn)給學(xué)生一句或一段不完整的話或者直接提問，要求學(xué)生簡要做答。當(dāng)教師的目的是考查學(xué)生對(duì)知識(shí)的回憶時(shí)，填空題十分有用，它可將學(xué)生猜測的可能性降到最小。如果經(jīng)過精心設(shè)計(jì)，也可以通過填空題來考查學(xué)生對(duì)知識(shí)記憶和理解、以及推理和判斷能力。填空題的問題在于，學(xué)生的答案各不相同甚至還會(huì)出現(xiàn)出人意料的答案，學(xué)生的答案還會(huì)受筆跡、用詞等無關(guān)因素的影響。

2．主觀題

主觀題則要求學(xué)生自己組織材料，并采用合適的方式表達(dá)陳述出來。這類題型包括論文題及問題解決題。教師在評(píng)分時(shí)，對(duì)學(xué)生的回答需要給出不同量的分值，而不僅僅是滿分或零分。

(1)論文題。論文題是指要求學(xué)生用文字論述方式闡述相關(guān)觀點(diǎn)的題目，回答字?jǐn)?shù)可以從幾段到幾大頁不等。一般較常使用的有兩種類型，有限制的問答題和開放式論文。

論文題可以測驗(yàn)知識(shí)、理解或運(yùn)用水平，也可考查學(xué)生的分析、綜合、類比和評(píng)估知識(shí)的能力，還可考查學(xué)生組織信息或表達(dá)陳述某項(xiàng)意見的能力。

使用論文題也有不妥之處。首先，學(xué)生回答論文題需要花費(fèi)很多時(shí)間，對(duì)課程內(nèi)容的取樣也就非常有限。通過增加小的論文題(即簡答題或問答題)，可以避免這個(gè)問題。其次，對(duì)于熟悉自己學(xué)生的教師，在判卷時(shí)很難做到客觀，導(dǎo)致信度較低。在評(píng)分時(shí)，經(jīng)常出現(xiàn)一種現(xiàn)象——暈輪效應(yīng)，即教師對(duì)學(xué)生的總體印象影響到對(duì)論文題目的評(píng)價(jià)。因?yàn)槠綍r(shí)的接觸或者前面幾道題解答的情況，陡得教師對(duì)學(xué)生形成了某種印象，從而影響到對(duì)之后題目的評(píng)判。

(2)問題解決題。問題解決題是向?qū)W生提供一定的問題情境和目標(biāo)情境，要求學(xué)生通過對(duì)知識(shí)進(jìn)行組織、選擇和運(yùn)用等復(fù)雜的程序來解決問題。通常有兩種形式，一種是間接測驗(yàn)，采用紙筆測驗(yàn)來評(píng)價(jià)學(xué)生的學(xué)業(yè)成就或能力。另一種方式則是直接測驗(yàn)，也叫做操作評(píng)價(jià)。例如，為了考查學(xué)生學(xué)習(xí)本節(jié)內(nèi)容的情況，讓學(xué)生編制一份測驗(yàn)小學(xué)兩步應(yīng)用題的測題。操作評(píng)價(jià)對(duì)于考查高級(jí)思維技能十分有效，但是往往費(fèi)時(shí)費(fèi)錢，而且主觀性較大，并且效度也經(jīng)常受到質(zhì)疑。

★例，單選（陜西 2009年）

在教師自編測驗(yàn)里，下面哪一類題型是主觀題（ d ）

a 選擇題 b 判斷題 c 填空題 d 論述題

（四）有效自編測驗(yàn)的特征

1．信度

信度：是指測驗(yàn)的可靠性，即多次測驗(yàn)分?jǐn)?shù)的穩(wěn)定、一致的程度。它既包括在時(shí)間上的一致性，也包括內(nèi)容和不同評(píng)分者之間的一致性。

例如，采用性格量表測量學(xué)生，他們?cè)谶@一個(gè)月的結(jié)果，如果大致等于六個(gè)月前和三個(gè)月前的得分，那么我們就認(rèn)為測驗(yàn)的信度較高。

★例，單選（甘肅 2008年）

某一測驗(yàn)在多次施測后所得到的分?jǐn)?shù)的穩(wěn)定、一致程度，即 ( a )

a 信度 b 效度

c 難度 d 區(qū)分度

★例，名詞解釋（浙江 2008年）

信度：

2．效度

效度：是指測量的正確性，即一個(gè)測驗(yàn)?zāi)軌驕y量出其所要測量的東西的程度。

效度的重要性大干信度，因?yàn)橐粋€(gè)低效度的測驗(yàn)，即使具有很好的信度，也不能獲得有用的資料。

例如，用磅秤稱量體重，連續(xù)多次都會(huì)得到相同的值，而且準(zhǔn)確地反映了個(gè)體的重量，那么信度和效度都很高；但是如果使用它來測量身高，雖然測量值之間總是保持一致的，即信度很好，但是并沒有說明個(gè)體的高度，因而不是適宜的測量身高的工具。

★例，單選（湖北 2009年）

衡量一個(gè)測驗(yàn)有效性、正確性的重要指標(biāo)是（ b ）

a.信度 b.效度

c.難度 d.區(qū)分度

★例，判斷（北京 2010年）

標(biāo)識(shí)測驗(yàn)的正確性、準(zhǔn)確性的是測驗(yàn)的效度。

3．區(qū)分度

區(qū)分度：是指測驗(yàn)項(xiàng)目對(duì)所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學(xué)生對(duì)測驗(yàn)項(xiàng)目的反應(yīng)與某種參照標(biāo)準(zhǔn)之間的關(guān)系來估計(jì)的。例如，可用年級(jí)或教師評(píng)定的等級(jí)作標(biāo)準(zhǔn)，看測驗(yàn)的項(xiàng)目能否把不同年級(jí)或不同水平的學(xué)生區(qū)分開來。

(五)自編測驗(yàn)的常見錯(cuò)誤

1．教師過于相信自己的主觀判斷：而忽視測驗(yàn)的信度和效度指標(biāo)。

2．許多教師對(duì)測驗(yàn)準(zhǔn)備的重要性缺足夠的認(rèn)識(shí)，對(duì)測驗(yàn)準(zhǔn)備不夠充分，甚至沒有準(zhǔn)備。

3．許多教師編制的測驗(yàn)太簡單，題：量太小?？傊?，測驗(yàn)準(zhǔn)備不充分、題量小、相信主觀判斷，都會(huì)導(dǎo)致過分強(qiáng)調(diào)無關(guān)細(xì)節(jié)，從而忽略本章提到的那些重要的原則或注意事項(xiàng)。

三、非測驗(yàn)的評(píng)價(jià)技術(shù)

尤其是情感領(lǐng)域的教學(xué)評(píng)價(jià)更需要采用非紙筆測驗(yàn)。情感教學(xué)不屬于任何一個(gè)學(xué)科，其效果可能產(chǎn)生在任何一種認(rèn)知學(xué)科的教學(xué)過程中。

(一)案卷分析

案卷分析是一種常用的評(píng)價(jià)策略，其內(nèi)容主要是按照一定標(biāo)收集起來的學(xué)生認(rèn)知活動(dòng)的成果。例如，學(xué)生的家庭作業(yè)或課堂練習(xí)、論文、日記、手工制作的模型、繪畫等各種作品。對(duì)學(xué)生的作品進(jìn)行考查分析，并形成某種判斷和決策的過程就是案卷分析。

(二)觀察

通過教學(xué)過程中的非正式觀察教師也能夠搜集到大量的關(guān)于學(xué)生學(xué)業(yè)成就的信息。這種觀察不只限于智能的發(fā)展，還包括學(xué)生生理、社會(huì)和情緒的發(fā)展。

1．行為檢查單

教師可以使用檢查單來記錄其在教學(xué)中的觀察結(jié)果。檢查單一般包括一系列教師認(rèn)為重要的目標(biāo)行為，通常采用有／無的方式記錄，但有時(shí)也記錄下次數(shù)。行為檢查單使用簡便易行，對(duì)于教師非常有用。尤其在課堂上，教師可以利用檢查單及時(shí)記下所觀察到的行為，便于指導(dǎo)和幫助學(xué)生。如果行為是屬于某一個(gè)好一壞連續(xù)體上的某一點(diǎn)，那么更適宜的方式是等級(jí)評(píng)價(jià)量表。當(dāng)觀察目標(biāo)是具體、特定的經(jīng)過r明確界定的行為時(shí)，檢查單非常有效。

2．軼事記錄

軼事記錄是描述所觀察的事件。與檢查單相比，軼事記錄可提供比較詳細(xì)的信息，這些記錄一般按照發(fā)生時(shí)間排列的。教師可以在事先有明確的觀察目標(biāo)，就某一方面的行為進(jìn)行記錄；也可以沒有明確目的，事后再專門分析或考查某一件事，這時(shí)教師就需要記下很多資料，甚至包括一些無關(guān)信息。軼事記錄要求教師純粹記載下所觀察到的內(nèi)容，而不要摻雜進(jìn)個(gè)人的意見或觀點(diǎn)。許多教師在他們的教案或工作日記上，都有軼事記錄。但是，軼事記錄比較費(fèi)時(shí)，而且也很難排除主觀偏見。

3．等級(jí)評(píng)價(jià)量表

等級(jí)評(píng)價(jià)量表對(duì)于連續(xù)性的行為，可能更為有效。它可用于判斷某種行為的發(fā)生頻率，以及某種操作或活動(dòng)的質(zhì)量，使得觀察信息被量化。評(píng)價(jià)量表是一種間接的觀察技術(shù)，通過量化所觀察的信息，可以迅速簡便地獲得概括化的信息。評(píng)價(jià)量表和行為檢查單有一定關(guān)系。二者都要求教師對(duì)學(xué)生的行為進(jìn)行判斷，可以在觀察過程中或結(jié)束后使用。但是它們的評(píng)價(jià)標(biāo)準(zhǔn)不同，檢查單只需要做定性的判斷，而等級(jí)評(píng)價(jià)量表是做定量的判斷。

（三）情感評(píng)價(jià)

許多時(shí)候，教師有必要針對(duì)學(xué)生的情緒、學(xué)習(xí)動(dòng)機(jī)、個(gè)人觀點(diǎn)等進(jìn)行評(píng)價(jià)。固然，在對(duì)結(jié)果的評(píng)價(jià)時(shí)，教師也需要寫一份詳細(xì)的報(bào)告，形式類似于上文的觀察報(bào)告。

四、教學(xué)評(píng)價(jià)結(jié)果的處理與報(bào)告

(一)評(píng)分

評(píng)分時(shí)必須以一定的比較標(biāo)準(zhǔn)為依據(jù)，評(píng)分的標(biāo)準(zhǔn)可分為絕對(duì)標(biāo)準(zhǔn)和相對(duì)標(biāo)準(zhǔn)兩種：

絕對(duì)標(biāo)準(zhǔn)是以學(xué)生所學(xué)的課程內(nèi)容為依據(jù)。它對(duì)應(yīng)的評(píng)價(jià)方式，是標(biāo)準(zhǔn)參照評(píng)價(jià)。

相對(duì)標(biāo)準(zhǔn)是以其他學(xué)生的成績?yōu)橐罁?jù)，對(duì)應(yīng)于常模參照評(píng)價(jià)。相對(duì)標(biāo)準(zhǔn)的評(píng)價(jià)不僅與學(xué)生自己的成績有關(guān)，還與其他同學(xué)的成績有關(guān)。

合理的評(píng)分過程應(yīng)包括如下步驟：①搜集有關(guān)學(xué)生的信息，信息可以來源于不同類型、性質(zhì)的測驗(yàn)甚至觀察的評(píng)價(jià)方式。例如，教師對(duì)學(xué)生期末學(xué)習(xí)成績的評(píng)價(jià)，通常是期末考試成績占70％，平時(shí)作業(yè)和考試成績占20％，課堂表現(xiàn)占10％。②系統(tǒng)地記錄下評(píng)價(jià)的結(jié)果，并隨時(shí)保持最新的結(jié)果。③盡量：將搜集的資料量化，用數(shù)據(jù)來表示學(xué)生的學(xué)習(xí)情況。④為了把評(píng)價(jià)的重點(diǎn)放在最終的學(xué)習(xí)成就，教師需要加大最后測驗(yàn)得分的權(quán)重。⑤評(píng)價(jià)應(yīng)該以成就為依據(jù)，而其他特征的評(píng)價(jià)，不要和成就的評(píng)價(jià)混雜起來。

（二）合格與不合格

有些課程采用合格與不合格來評(píng)價(jià)學(xué)生的成就。教師可以根據(jù)學(xué)生是否完成了每次作業(yè)來評(píng)價(jià)，也有可能根據(jù)學(xué)生的幾次作業(yè)情況評(píng)分，甚至評(píng)分的標(biāo)準(zhǔn)可以是學(xué)生的出勤情況。

（三）其他報(bào)告方式

除了常用的評(píng)分方法，教師還可以使用其他方式來報(bào)告評(píng)價(jià)結(jié)果。教師寫學(xué)生的個(gè)人鑒定或定期的綜合評(píng)價(jià)，提供給家長和學(xué)生。觀察報(bào)告也是一種報(bào)告評(píng)價(jià)結(jié)果的形式。此外，通過與家長面談，也可以交流關(guān)于學(xué)生的學(xué)習(xí)、行為和態(tài)度等方面的資料。

課后練習(xí)題

1.教學(xué)評(píng)價(jià)：

2.標(biāo)準(zhǔn)參照評(píng)價(jià)：

3.信度：

4.效度：

5.區(qū)分度：

6.案卷分析：

7.簡述教學(xué)評(píng)價(jià)與測量和測驗(yàn)的關(guān)系。

8.簡述標(biāo)準(zhǔn)化成就測驗(yàn)的特征。

9.簡述自編測驗(yàn)的類型。

10.簡述記錄觀察結(jié)果的方式。

參考答案：

1.教學(xué)評(píng)價(jià)是指有系統(tǒng)地收集有關(guān)學(xué)生學(xué)習(xí)行為的資料，參照預(yù)定的教學(xué)目標(biāo)對(duì)其進(jìn)行價(jià)值判斷的過程。

2.標(biāo)準(zhǔn)參照評(píng)價(jià)是基于某種特定的標(biāo)準(zhǔn)，來評(píng)價(jià)學(xué)生對(duì)與教學(xué)密切關(guān)聯(lián)的具體知識(shí)和技能的掌握程度。

3.信度是指測驗(yàn)的可靠性，即多次測驗(yàn)分?jǐn)?shù)的穩(wěn)定、一致的程度。它既包括在時(shí)間上的一致性，也包括內(nèi)容和不同評(píng)分者之間的一致性。

4.效度是指測量的正確性，即一個(gè)測驗(yàn)?zāi)軌驕y量出其所要測量的東西的程度。

5.區(qū)分度是指測驗(yàn)項(xiàng)目對(duì)所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學(xué)生對(duì)測驗(yàn)項(xiàng)目的反應(yīng)與某種參照標(biāo)準(zhǔn)之間的關(guān)系來估計(jì)的。例如，可用年級(jí)或教師評(píng)定的等級(jí)作標(biāo)準(zhǔn)，看測驗(yàn)的項(xiàng)目能否把不同年級(jí)或不同水平的學(xué)生區(qū)分開來。

6.案卷分析是一種常用的評(píng)價(jià)策略，其內(nèi)容主要是按照一定標(biāo)收集起來的學(xué)生認(rèn)知活動(dòng)的成果。

7.測量和測驗(yàn)是對(duì)學(xué)習(xí)結(jié)果的客觀描述，而教學(xué)評(píng)價(jià)則是對(duì)客觀結(jié)果的主觀判斷與解釋，但這種主觀判斷和解釋必須以客觀描述為基礎(chǔ)，否則是主觀臆想。測量與測驗(yàn)所得到的結(jié)果，只有通過教學(xué)評(píng)價(jià)，才能判斷這種客觀描述的實(shí)際意義，否則所得數(shù)據(jù)或結(jié)果毫無實(shí)際價(jià)值。

8.客觀性、計(jì)劃性、可比性。

9.客觀題、主觀題。

10.行為檢查單、軼事記錄、等級(jí)評(píng)價(jià)量表。

一级做a爱片,色站综合,99偷拍视频精品一区二区,亚洲精品色无码AV