各位同行:建議大家認真閱讀此文,相信能為大家提供有用的參考。
中考試題難度、信度、效度和區(qū)分度的把握和控制
南寧市教科所 鄧雅學
初中升學考試是義務教育終結后的選拔性考試,是衡量學生學習成效的重要手段,也是高中階段學校招生的重要依據(jù)。中考具有的高利害特征,對考試的科學性和合理性提出了很高的要求。為了使考試能夠客觀、準確地考查、測量學生的學習成效、學習能力及其發(fā)展?jié)撃埽旅婢驮囶}的難度、信度、效度和區(qū)分度的把握和控制提出幾點要求。
一、試題難度的控制
試題的難度是評價試題質(zhì)量的重要指標,在考試學中它被定義為:該題考生所得的平均分與該題總分的比值(通過率)。簡單講,難度就是指題目的難易程度。一道題目,如果大部分考生都答對,它的難度就小,反之難度就大。
試題的難度直接影響考試的及格率和優(yōu)秀率,對考試的信度、效度、區(qū)分度也會產(chǎn)生重大影響。因此,有效控制難度,是考試命題的基本要求之一。
(一)影響試題難度的幾個因素
影響試題難度的因素很多,主要有以下四個方面:
1、學生對試題的熟悉程度。一是對題型的熟悉程度,二是對題目內(nèi)容的熟悉程度。一般地說,常見常練的題型,直接從教材取材的題目,學生容易做,難度就??;反之難度就大。
2、題目包含信息量的多少。學生答題,要先閱讀題目的內(nèi)容,如果題目信息量太多,或者文字不簡潔,條理不清,或者圖表指向不明確,都會影響學生讀題,使題目的難度增加。
3、題目結構的復雜程度。包括題目的類型、知識的綜合程度和知識間聯(lián)系的復雜程度等等,都會對題目的難度產(chǎn)生影響。比如,選擇題中的多選題,如果全部選對才給分,它的難度顯然比單選題大。
4、題目的變化動態(tài)。題目的迷惑性、干擾性,題目設置的靈活程度,題目隱含的已知條件等等,都會對題目的難度產(chǎn)生影響。
命題者設定試題難度時,必須考慮以上四個方面的因素。
(二)試題的難度計算
1、二分法計分題目的難度。
“二分法計分題目”即答對給分,答錯不給分的題目,如單項選擇題、是非判斷題等。這類題目的難度指標通常用通過率來表示,即以答對該題的人數(shù)來表示。
假設全體考生人數(shù)為N,答對該題目的考生為R,通過率為P,則:P=R÷N×100%
P值越大,題目越容易;反之題目越難。
2、非二分法題目的難度。
“非二分法題目”即用從零分到滿分之間的數(shù)字來計分的題目,如作文題、計算題、論述題等。
假設該題考生的平均得分為R,該題的滿分為N,難度值為P,則:P=R÷N
P值越大,題目越容易;反之題目越難。
3、難度系數(shù)的校正。
對于選擇性題目來說,由于猜測的因素,考生的得分可能比真實得分要高。采用通過率方式來計算難度,可能產(chǎn)生偏差,即夸大了部分考生的能力,降低了題目的難度。為此,可用以下方法進行矯正:
假設選項的數(shù)目為K,通過率為P,校正后的通過率為CP,則:CP=(KP-1)÷(K-1)
當選項的數(shù)目很大,猜測的概率很小時,CP值就會很接近P值。
二、試卷難度水平的確定
試卷難度水平的確定取決于考試的性質(zhì)和目的。就選拔性考試而言,應該使試卷的難度系數(shù)接近錄取率。然而,我市城區(qū)已經(jīng)基本普及高中階段教育,中考的目的不僅是選拔,更是為了區(qū)分考生適合于到那類學校就讀。因此,設置試卷的難度時要注意:
1、各科的試卷中必須有一定數(shù)量的題目,用于考查初中畢業(yè)生應該具備的知識和技能,屬于較易題,這部分題目可以不必過多地考慮難度,它應占整個試卷題量的十分之七。
2、試卷中另有一部分題目,是中等水平的考生才會做的,屬于中等題,它的難度系數(shù)應為0.5左右,題量應占整個試卷的十分之二。
3、試卷中較難的題目,占整卷的十分之一,它的難度系數(shù)可控制在0.2~0.4之間。
各科試題的平均難度為:數(shù)學、物理0.65±0.03,其他學科0.7±0.03。
三、試卷的信度
信度是指測量結果的穩(wěn)定性和可靠性。命、審題人員通過對考試結果的穩(wěn)定性和可靠性進行分析,檢驗試卷是否能穩(wěn)定地、一致地反映考生的知識和能力,從而驗證試卷編制是否恰當。在選拔性考試中,試卷的信度決定著選拔的質(zhì)量,它是考試選拔的“標準尺子”。
(一)決定試卷信度的四個要素
1、試卷結構是否合理。即試卷能否覆蓋考查的內(nèi)容,能否做到重點突出,難易得當。
2、題型設計和搭配是否恰當。即試卷是否具備不同題型,主觀題和客觀題是否合理搭配,能否考查學生多方面的能力。
3、試題答案的可信程度。客觀題的答案具有唯一性,可信程度高。主觀題由于受到一些不穩(wěn)定因素的影響(如評分者的偏好、評分者對評分標準的理解等等),答案的信度不及客觀題高。
4、評分者的綜合素質(zhì)。包括知識經(jīng)驗、職業(yè)道德、法紀觀念、精力體力等等。評分者的信度反映了評分能夠穩(wěn)定反映考生真實水平的程度。信度越高,評分誤差越小,考試的質(zhì)量越高。
(二)保證試卷信度的相應措施
1、合理安排試卷的結構。根據(jù)考試范圍和要求,將考查內(nèi)容合理劃分,形成梯度結構和科學、完整的編排系列。例如語文試卷,可分為“積累與運用”、“文言文閱讀”、“現(xiàn)代文閱讀”、“寫作”四大塊,合理安排題量和配分。
2、合理采用不同的題型。包括選擇題、問答題、填充題、計算題、圖文題、論述題等,主觀題和客觀題的比例要恰如其分。是非判斷題由于受猜測因素影響太大,選拔性考試一般不宜采用。
3、科學設置答題要點和評分細則。命題者對主觀題作出具體的答題要點,并合理配分,盡可能使主觀題的答案客觀化、標準化,以減少評分者主觀因素及外界不穩(wěn)定因素的影響??梢試L試設置一些開放性試題,言之成理即可給分。
4、嚴格挑選、培訓評卷人員,多個評分者評分。評卷人員的挑選要依照程序進行,評卷前要進行集中培訓。一些比較復雜的客觀題(如作文題)要經(jīng)過試評,并且由多個評分者評分;當多個評分者之間的評分出現(xiàn)矛盾時,可以通過討論來減少分歧。
四、試卷的效度
效度是指試卷的有效性,即試卷的使用是否達到了考試的目的。它是衡量一份試卷優(yōu)劣的最重要的指標,主要包含以下兩個方面的因素。
1、內(nèi)容效度
內(nèi)容效度是指題目對欲測的內(nèi)容范圍取樣的適當程度。中考試卷要具備較好的內(nèi)容效度,必須滿足兩個條件:
(1)要有確定好的內(nèi)容范圍,并使全部題目都落在這一范圍之內(nèi)。
(2)試卷題目應是已界定的內(nèi)容范圍的代表性樣本(即題目能代表所測的內(nèi)容范圍的主要方面),且各部分題目所占比例恰當。
為此,命題人員在命制試題之前,必須完成下列工作:
A、 定義好內(nèi)容總體,描繪出有關知識與技能的大體范圍;
B、 劃分細綱目,根據(jù)其重要程度確定加權比例;
C、 確定每道題所考的內(nèi)容。
以上三個步驟體現(xiàn)為各學科試卷“雙向細目表”的制定。
2、效標關聯(lián)效度
效標是衡量試卷是否有效的參照物,亦即根據(jù)考試對象的狀況確定試卷是否有效。常見的效標有:學生的學業(yè)成績、等級評定、特殊訓練成績、學習表現(xiàn)等。
效標關聯(lián)效度就是考察試卷得分與學生的平時表現(xiàn),從而確定試卷的有效程度。中考試卷效度的測量,主要以學生在初中階段的成績?yōu)閰⒄?。假如平時成績好的學生,考試成績也好;成績差的學生考試成績也差,這份試卷的效度就高。
試卷效度的預測,必須在具有信度的前提下進行;而它真實效度,要在評卷結束后,通過收集學生的平時表現(xiàn)才能得出。
五、試題的區(qū)分度
試題的區(qū)分度是指題目對考生實際水平的區(qū)分程度。一般地說,能力高的學生得分高,能力低的學生得分低,試題的區(qū)分度就高。題目得分均勻,分不出高低,區(qū)分度就低。區(qū)分度主要用于以選拔為目的的試題,尤其是較難題,一些基礎性的題目不用過多考慮。
題目的區(qū)分度可以用兩個指標來表示:
1、相關系數(shù)
即計算題目通過率與試卷總分的相關。計算的方法有點二列相關、二列相關、積差相關等。相關系數(shù)高于0.20的題目一般可以保留,如果接近于零或負數(shù)時,應作重大修改或刪除。
2、鑒別力指數(shù)
即通過比較試卷總分高低的兩組考生在題目上的通過率,得到差值,從而鑒別題目測量效標的有效性。
由于試題的區(qū)分度是在考試之后才能確定,命題時只能通過命題者的分析去把握,因此只作簡單的介紹。
中考試題的難度、信度、效度和區(qū)分度的把握和控制,是中考命題的關鍵技術,在此提出來,與大家共同探討。
(本文發(fā)表于《廣西教育》2006年中教版5B)