一级做a爱片,色站综合,99偷拍视频精品一区二区,亚洲精品色无码AV

第二節(jié)  教學測量與評價的方法和技術(shù)

教學評價包括認知、情感和技能三個方面。對于認知和技能領(lǐng)域的學業(yè)成就,最常用的教學評價手段是標準化成就測驗和教師自編測驗。而對于情感以及道德行為表現(xiàn)則常常采用非測驗性的評價手段,如案卷分析、觀察、問卷量表以及談話等。這些非測驗性的評價手段也可作為學業(yè)成就評價的補充。

一、標準化成就測驗

(一)標準化成就測驗的含義及特點

      標準化成就測驗是指由專家或?qū)W者們所編制的適用于大規(guī)模范圍內(nèi)評定個體學業(yè)成就水平的測驗。

其特點大致為:測驗是由專門機構(gòu)或?qū)<覍W者按一定測驗理論和技術(shù),根據(jù)全國或某一地區(qū)所有學校的共同教育目標來編制的。所有受試人所做的試題、時限等施測條件相同,計分手段和分數(shù)的解釋也完全相同。

(二)標準化成就測驗的優(yōu)越性

第一,客觀性。在大多數(shù)情境下,標準化測驗是一種比教師發(fā)展出的測驗更加客觀的測量工具。

第二,計劃性。專家在編制標準化測驗時,已經(jīng)考慮到所需的時間和經(jīng)費,因此標準化測驗比大部分的課堂測驗更有計劃性。

第三,可比性。標準化測驗由于具有統(tǒng)一的參照標準,使得不同考試的分數(shù)具有可比性。

標準化測驗的局限性:

第一,與學校課程之間的關(guān)系很不協(xié)調(diào)。

第二,測驗結(jié)果的不當使用,我們通常利用標準化成就和能力測驗對學生分

類和貼標簽,對個體造成了不良影響。它們的使用對得低分的學生傷害尤大。

二、教師自編測驗

    ()自編測驗的含義與特點

教師自編測驗是由教師根據(jù)具體的教學目標、教材內(nèi)容和測驗?zāi)康?,自己編制的測驗,是為特定的教學服務(wù)的。教師自編測驗通常用于測量學生的學習狀況,而標準化成就測驗則用來判斷學生與常模相比時所處的水平。

()測驗前的計劃

  1.確定測驗的目的。

  2.確定測驗要考查的學習結(jié)果。

  3.列出測驗要包括的課程內(nèi)容。

  4.寫下考試計劃或細目表。細目表是將考試具體化的最重要的工具,使得測驗?zāi)軌蚺c教學的目標和內(nèi)容保持一致。細目表的形式是兩維表,一般縱欄表示學習結(jié)果,橫欄表示課程的內(nèi)容或范圍。中間的欄目,就是教師根據(jù)自己的情況填上在測驗中計劃測量多大比例的學習結(jié)果和課程內(nèi)容。

5.針對計劃測量的學習結(jié)果,選擇適合的題型。自編測驗包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗的目的、內(nèi)容和時間決定的。一般來說,由于這兩種題型各有優(yōu)點和不足,最好加以綜合使用。

()自編測驗的類型

  1.客觀題

  客觀題具有良好的結(jié)構(gòu),對學生的反應(yīng)限制較多。學生的回答只有對、錯之分,因此教師評分也就只可能是得分或失分。這類題目包括選擇題、是非題、匹配題和填空題等。

    (1)選擇題。選擇題是由題干和兩個或更多的選項組成的。題干可以是直接提問或者以不完整的句子的形式出現(xiàn),目的是為了設(shè)置問題情境。而選項則提供可供選擇的答案,包括一個正確答案和若干具有干擾性的錯誤項或迷惑項。學生的任務(wù)就是閱讀題目,再從一系列選項中挑選出正確的項目。

此外,選擇題還有一種常用變式,選項中有一至多個正確答案,即通常被稱為多選題。這種題型的難度大大高于常規(guī)的選擇題(單選題),可以有效地檢查高一級的學習成果,在測驗中使用得較廣。

(2)是非題。是非題與選擇題有一點相似之處,學生需要識別、選擇出正確答案。常用的形式是,陳述一句話要求學生判斷對錯或是非。是非題可用于測量不同水平的教學目標。

是非題形式簡單,能夠在一份試卷內(nèi)覆蓋大量的內(nèi)容。教師在評判時也較客觀,計分簡便省時。但是,一個重要的問題是:學生只有兩種選擇——對或錯,所以即使在完全猜測的情況下,他們也有50%的機會選擇到正確答案。一種可行的辦法是,增加題目的數(shù)量。由于題量大,對題目總體的取樣較全面,學生很難只憑猜測獲得高分。

(3)匹配題。匹配題是另一種可提供多種選擇的考試形式。通常,題目包括兩列詞句,一列是問題選項,一列是反應(yīng)選項。學生根據(jù)題意按照某種關(guān)系將左右的項目連接起來。匹配題形式簡單,能夠有效地測量學生對知識聯(lián)系的掌握情況,且易于計分。但是,它只能用于測查彼此存在著簡單關(guān)系的知識。

(4)填空題。填空題是呈現(xiàn)給學生一句或一段不完整的話或者直接提問,要求學生簡要做答。當教師的目的是考查學生對知識的回憶時,填空題十分有用,它可將學生猜測的可能性降到最小。如果經(jīng)過精心設(shè)計,也可以通過填空題來考查學生對知識記憶和理解、以及推理和判斷能力。填空題的問題在于,學生的答案各不相同甚至還會出現(xiàn)出人意料的答案,學生的答案還會受筆跡、用詞等無關(guān)因素的影響。

2.主觀題

主觀題則要求學生自己組織材料,并采用合適的方式表達陳述出來。這類題型包括論文題及問題解決題。教師在評分時,對學生的回答需要給出不同量的分值,而不僅僅是滿分或零分。

(1)論文題。論文題是指要求學生用文字論述方式闡述相關(guān)觀點的題目,回答字數(shù)可以從幾段到幾大頁不等。一般較常使用的有兩種類型,有限制的問答題和開放式論文。

論文題可以測驗知識、理解或運用水平,也可考查學生的分析、綜合、類比和評估知識的能力,還可考查學生組織信息或表達陳述某項意見的能力。

使用論文題也有不妥之處。首先,學生回答論文題需要花費很多時間,對課程內(nèi)容的取樣也就非常有限。通過增加小的論文題(即簡答題或問答題),可以避免這個問題。其次,對于熟悉自己學生的教師,在判卷時很難做到客觀,導(dǎo)致信度較低。在評分時,經(jīng)常出現(xiàn)一種現(xiàn)象——暈輪效應(yīng),即教師對學生的總體印象影響到對論文題目的評價。因為平時的接觸或者前面幾道題解答的情況,陡得教師對學生形成了某種印象,從而影響到對之后題目的評判。

(2)問題解決題。問題解決題是向?qū)W生提供一定的問題情境和目標情境,要求學生通過對知識進行組織、選擇和運用等復(fù)雜的程序來解決問題。通常有兩種形式,一種是間接測驗,采用紙筆測驗來評價學生的學業(yè)成就或能力。另一種方式則是直接測驗,也叫做操作評價。例如,為了考查學生學習本節(jié)內(nèi)容的情況,讓學生編制一份測驗小學兩步應(yīng)用題的測題。操作評價對于考查高級思維技能十分有效,但是往往費時費錢,而且主觀性較大,并且效度也經(jīng)常受到質(zhì)疑。

★例,單選(陜西  2009年)

在教師自編測驗里,下面哪一類題型是主觀題( d

a 選擇題      b  判斷題    c  填空題    d  論述題

(四)有效自編測驗的特征

    1.信度

    信度:是指測驗的可靠性,即多次測驗分數(shù)的穩(wěn)定、一致的程度。它既包括在時間上的一致性,也包括內(nèi)容和不同評分者之間的一致性。

例如,采用性格量表測量學生,他們在這一個月的結(jié)果,如果大致等于六個月前和三個月前的得分,那么我們就認為測驗的信度較高。

★例,單選(甘肅  2008年)

某一測驗在多次施測后所得到的分數(shù)的穩(wěn)定、一致程度,即 (  a   )

a 信度                b 效度

c 難度                d 區(qū)分度

★例,名詞解釋(浙江  2008年)

信度:

2.效度

效度:是指測量的正確性,即一個測驗?zāi)軌驕y量出其所要測量的東西的程度。

效度的重要性大干信度,因為一個低效度的測驗,即使具有很好的信度,也不能獲得有用的資料。

例如,用磅秤稱量體重,連續(xù)多次都會得到相同的值,而且準確地反映了個體的重量,那么信度和效度都很高;但是如果使用它來測量身高,雖然測量值之間總是保持一致的,即信度很好,但是并沒有說明個體的高度,因而不是適宜的測量身高的工具。

★例,單選(湖北  2009年)

衡量一個測驗有效性、正確性的重要指標是( b

a.信度             b.效度

c.難度             d.區(qū)分度

★例,判斷(北京  2010年)

標識測驗的正確性、準確性的是測驗的效度。

3.區(qū)分度

區(qū)分度:是指測驗項目對所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學生對測驗項目的反應(yīng)與某種參照標準之間的關(guān)系來估計的。例如,可用年級或教師評定的等級作標準,看測驗的項目能否把不同年級或不同水平的學生區(qū)分開來。

()自編測驗的常見錯誤

    1.教師過于相信自己的主觀判斷:而忽視測驗的信度和效度指標。

    2.許多教師對測驗準備的重要性缺足夠的認識,對測驗準備不夠充分,甚至沒有準備。

3.許多教師編制的測驗太簡單,題:量太小??傊?,測驗準備不充分、題量小、相信主觀判斷,都會導(dǎo)致過分強調(diào)無關(guān)細節(jié),從而忽略本章提到的那些重要的原則或注意事項。

三、非測驗的評價技術(shù)

尤其是情感領(lǐng)域的教學評價更需要采用非紙筆測驗。情感教學不屬于任何一個學科,其效果可能產(chǎn)生在任何一種認知學科的教學過程中。

    ()案卷分析

案卷分析是一種常用的評價策略,其內(nèi)容主要是按照一定標收集起來的學生認知活動的成果。例如,學生的家庭作業(yè)或課堂練習、論文、日記、手工制作的模型、繪畫等各種作品。對學生的作品進行考查分析,并形成某種判斷和決策的過程就是案卷分析。

()觀察

    通過教學過程中的非正式觀察教師也能夠搜集到大量的關(guān)于學生學業(yè)成就的信息。這種觀察不只限于智能的發(fā)展,還包括學生生理、社會和情緒的發(fā)展。

    1.行為檢查單

教師可以使用檢查單來記錄其在教學中的觀察結(jié)果。檢查單一般包括一系列教師認為重要的目標行為,通常采用有/無的方式記錄,但有時也記錄下次數(shù)。行為檢查單使用簡便易行,對于教師非常有用。尤其在課堂上,教師可以利用檢查單及時記下所觀察到的行為,便于指導(dǎo)和幫助學生。如果行為是屬于某一個好一壞連續(xù)體上的某一點,那么更適宜的方式是等級評價量表。當觀察目標是具體、特定的經(jīng)過r明確界定的行為時,檢查單非常有效。

2.軼事記錄

軼事記錄是描述所觀察的事件。與檢查單相比,軼事記錄可提供比較詳細的信息,這些記錄一般按照發(fā)生時間排列的。教師可以在事先有明確的觀察目標,就某一方面的行為進行記錄;也可以沒有明確目的,事后再專門分析或考查某一件事,這時教師就需要記下很多資料,甚至包括一些無關(guān)信息。軼事記錄要求教師純粹記載下所觀察到的內(nèi)容,而不要摻雜進個人的意見或觀點。許多教師在他們的教案或工作日記上,都有軼事記錄。但是,軼事記錄比較費時,而且也很難排除主觀偏見。

3.等級評價量表

等級評價量表對于連續(xù)性的行為,可能更為有效。它可用于判斷某種行為的發(fā)生頻率,以及某種操作或活動的質(zhì)量,使得觀察信息被量化。評價量表是一種間接的觀察技術(shù),通過量化所觀察的信息,可以迅速簡便地獲得概括化的信息。評價量表和行為檢查單有一定關(guān)系。二者都要求教師對學生的行為進行判斷,可以在觀察過程中或結(jié)束后使用。但是它們的評價標準不同,檢查單只需要做定性的判斷,而等級評價量表是做定量的判斷。

(三)情感評價

許多時候,教師有必要針對學生的情緒、學習動機、個人觀點等進行評價。固然,在對結(jié)果的評價時,教師也需要寫一份詳細的報告,形式類似于上文的觀察報告。

四、教學評價結(jié)果的處理與報告

()評分

評分時必須以一定的比較標準為依據(jù),評分的標準可分為絕對標準和相對標準兩種:

絕對標準是以學生所學的課程內(nèi)容為依據(jù)。它對應(yīng)的評價方式,是標準參照評價。

相對標準是以其他學生的成績?yōu)橐罁?jù),對應(yīng)于常模參照評價。相對標準的評價不僅與學生自己的成績有關(guān),還與其他同學的成績有關(guān)。

合理的評分過程應(yīng)包括如下步驟:①搜集有關(guān)學生的信息,信息可以來源于不同類型、性質(zhì)的測驗甚至觀察的評價方式。例如,教師對學生期末學習成績的評價,通常是期末考試成績占70%,平時作業(yè)和考試成績占20%,課堂表現(xiàn)占10%。②系統(tǒng)地記錄下評價的結(jié)果,并隨時保持最新的結(jié)果。③盡量:將搜集的資料量化,用數(shù)據(jù)來表示學生的學習情況。④為了把評價的重點放在最終的學習成就,教師需要加大最后測驗得分的權(quán)重。⑤評價應(yīng)該以成就為依據(jù),而其他特征的評價,不要和成就的評價混雜起來。

(二)合格與不合格

有些課程采用合格與不合格來評價學生的成就。教師可以根據(jù)學生是否完成了每次作業(yè)來評價,也有可能根據(jù)學生的幾次作業(yè)情況評分,甚至評分的標準可以是學生的出勤情況。

    (三)其他報告方式

除了常用的評分方法,教師還可以使用其他方式來報告評價結(jié)果。教師寫學生的個人鑒定或定期的綜合評價,提供給家長和學生。觀察報告也是一種報告評價結(jié)果的形式。此外,通過與家長面談,也可以交流關(guān)于學生的學習、行為和態(tài)度等方面的資料。

課后練習題

1.教學評價:

2.標準參照評價:

3.信度:

4.效度:

5.區(qū)分度:

6.案卷分析:

7.簡述教學評價與測量和測驗的關(guān)系。

8.簡述標準化成就測驗的特征。

9.簡述自編測驗的類型。

10.簡述記錄觀察結(jié)果的方式。

參考答案:

1.教學評價是指有系統(tǒng)地收集有關(guān)學生學習行為的資料,參照預(yù)定的教學目標對其進行價值判斷的過程。

2.標準參照評價是基于某種特定的標準,來評價學生對與教學密切關(guān)聯(lián)的具體知識和技能的掌握程度。

3.信度是指測驗的可靠性,即多次測驗分數(shù)的穩(wěn)定、一致的程度。它既包括在時間上的一致性,也包括內(nèi)容和不同評分者之間的一致性。

4.效度是指測量的正確性,即一個測驗?zāi)軌驕y量出其所要測量的東西的程度。

5.區(qū)分度是指測驗項目對所測量屬性或品質(zhì)的區(qū)分程度或鑒別能力。它是根據(jù)學生對測驗項目的反應(yīng)與某種參照標準之間的關(guān)系來估計的。例如,可用年級或教師評定的等級作標準,看測驗的項目能否把不同年級或不同水平的學生區(qū)分開來。

6.案卷分析是一種常用的評價策略,其內(nèi)容主要是按照一定標收集起來的學生認知活動的成果。

7.測量和測驗是對學習結(jié)果的客觀描述,而教學評價則是對客觀結(jié)果的主觀判斷與解釋,但這種主觀判斷和解釋必須以客觀描述為基礎(chǔ),否則是主觀臆想。測量與測驗所得到的結(jié)果,只有通過教學評價,才能判斷這種客觀描述的實際意義,否則所得數(shù)據(jù)或結(jié)果毫無實際價值。

8.客觀性、計劃性、可比性。

9.客觀題、主觀題。

10.行為檢查單、軼事記錄、等級評價量表。

日本欧美黄色| 亚洲乱亚洲乱妇50p| 高清免费av| 中文字幕AV二区| 丁香色视频网站首页| 无遮挡呻吟| 日本道| a级片免费在线观看| 人妻少妇调教| 日本凹凸偷拍| 男人扒开女人桶| 国产精品久久久久久久| 一本之道久久| 亚洲综合123| 成人在线免费毛片| 特别69无码免费| 色影视| 日本高潮视频| 亚洲无码流出一区二区| 超碰 超碰| 人妻酒店自拍| 成人影院在线观看| 国产嘿嘿嘿视频在线观看| 中国一级一级黄片| 久久久免费AV| 超碰HD| 国产精选h| 无码专区狠狠躁躁天天躁| 五月天激情丁香| 芒果av一区二区| 狠狠地操,狠狠地日| ady 狠狠亚洲| 色欲AV一区二区三区| 国产一区二区三区久久99| 永久网视频在线观看| 深夜真人无码999| 日韩啪啪视频无码| 亚洲欧美国产高清vA在线播放| 亚洲无码 人妻| 亚洲区123| 怡红院在线综合|