心理測量和量表操作
大概的介紹。
凡是客觀存在的事物都是有數(shù)量的。
——桑代克
凡是有數(shù)量的東西都是可以測量的。
——麥克爾
心理用間接測量。測量行為,來推測心理。
心理測量的結果不絕對。
I. 心理測量的發(fā)展史
一. 中國古代的心理測量思想與實踐
1905 法國——科學心理測量.
孔子——心理測量的思想
"中人以上,可以語上也;中人以下,不可以語上也。"
孟子"權,然后知輕重;度,然后知長短;物皆然,心為甚。"
劉劭《人物志》,"觀其感變,以審常度。"
翻譯后,名為《人類能力之研究》
韓非 一手畫圓,一手畫方。 到現(xiàn)在,用于測注意力
民間,周歲試兒 到現(xiàn)在,嬰幼兒的動作測量
古代的問答法 到現(xiàn)在,臨床談話法,問卷法
莊子:九征 到現(xiàn)在,情景法
博弈(棋)、九連環(huán)、七巧板——古代測智力水平的器具
八陣圖。
二. 心理測量早期探索及嘗試
英國 高爾頓 最早想通過測量人的證明他的"遺傳論"。
美國 卞特爾 心理學只有立足于實驗與測量之上,才會有自然科學的準確度。
德國 馮 特 心理測量的思想。
三. 科學心理測量的誕生與發(fā)展
1905 法國 比納(Binet)
1895創(chuàng)辦第一本心理學雜志《心理學年報》
心理測量的原理:把結果與他人比較,以求概括。
1905:比納-西蒙量表(的標志)-標志著科學心理測量的誕生。
30題,從易到難。
1908、1911兩次修訂,制訂了"智齡"之后,有斯坦福"-比納量表(推孟修訂,1916)[現(xiàn)在的所謂"比納量表]引入了斯騰(德國)的心理商數(shù)概念,變化為:
智齡
IQ=_____ *100使不同年齡層次間兒童的智力水平比較成為可能。也叫比率智商
實齡
后來量表的特點
I. 操作性量表(比納的量表是語言性量表)
II. 團體測驗 (比納的量表是個別的測驗)
III. 教育測驗(學習測驗,eg桑代克,斯坦福成就測驗)
IV. 人格的測驗
V. 特殊能力測驗(eg音樂,繪畫能力etc)
四. 心理測驗在中國的發(fā)展
1916 樊炳清 介紹比納的量表
1920 南京高等師范學校(現(xiàn)南大),廖世承、陳鶴琴開設心理測量課。之后,制定量表,開創(chuàng)雜志…
抗日戰(zhàn)爭開始一度中斷。
1979后,心理測量在中國走進輝煌。智力測驗方面,陸志韋,吳天敏;人格測驗方面,肖孝嶸;艾偉,學業(yè)成就方面。-中國國內(nèi)著名心理測量方面的學者。
第二章 心理測量的性質(zhì)
測量最基本的特征:對事物進行區(qū)分
一. 測量的基本問題。
1.定義 :利用一定的法則[現(xiàn)在,心理學中的法則還不完善,所以結果不精確]。
用數(shù)字對事物[心理學中,是對事物的特征及屬性]加以區(qū)分(描述)。
"數(shù)字"的特性:
I. 區(qū)分性
II. 等級性/序列性
III. 等距性
IV. 可加性
2.要素
絕對的零點(沒有此特性)-理想的參照點,加減乘除都可以
I. 參照點{
人為參照點 只能加減,不能乘除。
確定的意義
II. 單位應有{
相等的價值
心理測量中的單位,不具有上面的特點,所以單位不夠理想
eg"年齡"不具有相等的價值
∵4歲-5歲的1年比44-45的1年發(fā)展快得多。
3.種類
I. 名稱測量/類別 特征:僅區(qū)分功能,符號意義 使用數(shù)學統(tǒng)計方法——次數(shù)、百分比、X2 、列聯(lián)相關
II. 等級(代表符號-大于號,小于號)特~_ 分等性
使~ 中位數(shù)、百分位數(shù)、等級相關,秩次相關
III. 等距測量 特~ 分等且等距
使~加減,均數(shù),標準差,t檢驗F檢驗
IV. 比率測量(最好的一種測量水平) 特~具有絕對零點
使~幾何均數(shù)、等比量數(shù),加減乘除
4.直接與間接測量
直接測量:準確
間接測量:需中介,可能失真
二. 測量的特征
1. 定義:依據(jù)一定的心理學理論,使用一定的操作程序,給人的行為定出數(shù)量化的價值。
2. 可行性
3. 性質(zhì)
I. 間接性(測外顯行為,推測大腦中的活動)
II. 相對性
III. 客觀性(測量要做到標準化)
4. 心理測量的水平
智力、價格測驗等:等級測量
∵無絕對零點 無等距的單位但,可轉(zhuǎn)化為標準分數(shù),則可使用等距測量的方法。
三. 心理測驗的基本概念
1. 定義 心理測驗是對行為樣組的和標準化的測量
(eg題目代表全域,則題目是↑,數(shù)據(jù)結果也域,則數(shù)據(jù)也是↑)測量的編制實施,評分,解釋都有一致性
四. 心理測驗的種類功能
I. 按功能分1.能力測驗 智力、潛力(eg職業(yè)能力)特殊能力
2.學習成就測驗 各科目的學習能力、技能掌握情況
3.人格測驗 態(tài)度、性格、情緒、氣質(zhì)
II. 按人數(shù)分1.個別測驗
2.團體測驗 比較特點
III. 按材料分1.器具測驗 一類 (不絕對)
2.文字測驗(紙筆測驗) 另一類
IV. 按目的分1.診斷測驗(具體)
2.篩選測驗(大致)[使用對象的不同]
功能
I. 人才選拔
II. 心理問題的預防與診斷
III. 對一個人能力等的評價
五. 怎樣正確對待心理測驗
編制量表示合理 使心理測驗有偏差的原因
實施測驗有問題
1.測驗保密(內(nèi)容保密、結果保密)
2.心理測驗的資格(接受過培訓、有考核)
3.測驗常模的使用范圍
4.不能"測定終身"。(過幾個月可再測幾次)
5.對測驗本身的認識。(參照其他各方面情況,得出適當?shù)慕Y果)
6.測驗結果不能作為歧視人的依據(jù),操作規(guī)范。
第三章 智力測驗
1. 概述
1.定義:
智力——對問題的理解與推理的一般能力。
——具有正相關的特殊能力的總和。
——產(chǎn)抽象思維為核心的多種能力的總和。
(國內(nèi)較認同)
2.智力測驗:
在一定條件下,使用特定的標準化測驗量表,對被試施加測驗,從被試的一定反應中測量共智力高低。
3.智齡與智商
I. 智齡
比率智商= 實齡 *100
推孟 10歲前 10-18
具體年齡點有
貝雷、韋克斯勒:13歲前 13-25
II. 離差智商
= X
同齡人-x
4.智商的穩(wěn)定性和可變性
穩(wěn)定性。時間間隔越短,相關越大;
第一次做,年齡小時做,與產(chǎn)后結果的相關越小(5歲后做較好)
可變性。
5.智商的分布和分類
分類:推孟的分類
IQ 140以上 120-140 110-120 90-110 80-90 70-80 50-70 25-50 25以下
類別 天才 上智 聰穎 中材 遲鈍 近愚 低能 無能 白癡
韋克斯勒的分類
IQ 類別 理論(百分比) 實際樣組
130以上 極優(yōu)秀 2.2 2.3
120-129 優(yōu)秀 6.7 7.4
110-119 中上 16.1 16.5
90-109 中等 50 49.4 }82%
80-89 中下 16.1 16.2
70-79 邊緣 6.7 6.0
70以下 智力缺陷 2.2 2.2
55-69輕度,可學習
40-55中度,可訓練
25-39重度,需護理,訓練后可處理
25以下 極重度,全護理。
6.智力的性別差異
總體上,沒有。
發(fā)展上,女性先快后慢;男性先慢后快。
女性在語言,記憶上強。男性在數(shù)理、空間上強。
女性分布集中,男性分布廣。
7.遺傳,環(huán)境對智力的影響
同卵雙生子 同一環(huán)境 .88(智力相關)
同卵雙生子 不同環(huán)境 .75
異生雙生子 相同環(huán)境 同性別 .60
{
不同性別 .50
同胞兄弟姐妹 相同環(huán)境 .50
不同環(huán)境 .35
無血緣關系,但自幼在同一環(huán)境下長大 .20
無血緣關系,但自幼在不同環(huán)境下長大 .00
另:親生父母與子女的智力相關 .50
養(yǎng)父母與子女的智力相關 .30
&2.智力理論
斯騰伯格《超越智商》
智力非一個單一結構,是一個綜合的有整體的結構
1.因素說,(英)斯皮爾曼
一般因素(G因素)
特殊因素(S因素)
2.多因素說,(美)桑代克-凱利。
反對二因素說(尤其是G因素)。
認為——智力是各種特殊能力的綜合
3.群因素(美)瑟斯頓
智力可以分為各種組群,每一組群都有一共同的G因素。分為七種組群(語文理解,語詞流暢,數(shù)字運算,空間關系,機械記憶、知覺速度、一般推理)
由于七個組群仍有較高相關,所以修改后的該理論加入了"次組因素"的說法。后來該理論被稱為"群因—一般因素,理論"。
4.卡特爾 流體智力與晶體智力。
流體~隨神經(jīng)系統(tǒng)成熟 該能力自然發(fā)展開。 是先天的。發(fā)展早衰退也早。
Eg.機械記憶,圖形分辨(反應)知覺速度。
晶體~:受后天環(huán)境。教育的影響。
發(fā)展晚,后來會加快。Eg.語詞.常識.詞匯
5.智力的三維結構(吉爾福特 美)
三維度 內(nèi)容 操作 成果
視聽 圖形 認知 單元
符號 記憶(短時 長時) 類別
語義 發(fā)散性思維 關系
行為 會聚性思維 系統(tǒng)
評價 轉(zhuǎn)換
蘊涵
4 * 5 * 6=120
細分有5 * 6 * 6=180(已找出105種因素)
6.三重結構論 斯騰伯格
(認為:傳統(tǒng)的智商是靜態(tài)的。)
情境理論
三重:{經(jīng)驗理論
成分理論——核心內(nèi)容
最基本的信息加工單元。元成分對其他成分進行計劃、評價、加工等。另,操作成分執(zhí)行元成分的指令,同時,有反饋;知識獲得成分,選擇問解解決的策略。
元成分:
操作成分 知識獲得成分
前兩種理論,從外部世界、經(jīng)驗角度來看。
情境理論指出智力是主體對環(huán)境的適應、選擇、改造。
經(jīng)驗理論指導測驗編制中應運用大多數(shù)人都有(或無)的經(jīng)驗?;蛐庐惢蚴煜?。
7.智力的PASS模型
(DSA 戴斯):要產(chǎn)全新的理論取代傳統(tǒng)的。 同時性
三個方面(三級認知功能)計劃-注意-加工
↓ 繼時性
這一狀態(tài)決定是兩步的基礎。
生理基礎:三級機能聯(lián)合區(qū)。(魯利亞)
DAS編制的智力測驗:DN認知評價系統(tǒng)。分四個分量表:
I. 第一分量表(計劃性功能系統(tǒng))
視覺搜索,計劃連接,數(shù)字匹配。
II. 第二分量表(注意-喚醒系統(tǒng))
III. 同時性加工
圖形記憶、矩陣問題,同時性言語加工。表現(xiàn)的注意,找數(shù)字,聽覺選擇注意。
IV. 繼時性加工
句子重復、句子問題、字詞測驗
&3.智力測驗
一. 福-比納量表(S-B量表)
1.19.6推孟第一次修訂 首次用"智商概念"(第一版)
1937推孟第一次修訂 采用復本的形式。(L版、M版)
1960推孟第三次修訂 刪除過時的題目,對題目重新排版,兩個版本合二為一,題量增加。(第三版)
1972在第三版上,對常模進行修改
1986第四次修訂版(桑代克Hagen)對S-B量表大規(guī)模修改(第四版)
↑現(xiàn)在使用的版本。
2.理論框架與構成
引八卡特爾的"流體""晶體"理論,及桑代克與Hagan的認知理論:∴理論框架是認知能力測驗。
構成:3層次,15分測驗
一般推理/理解能力
晶體智力 流體智力/分析能力 短時記憶
獲取、運用語文、 I珠子記憶
數(shù)字的知識來解決 抽象/視覺能力 II語句記憶
問題與學校教育有關 I對圖形或形態(tài)的分析 III數(shù)字記憶
II仿造/仿畫 IV物品記憶
III矩陣
IV折紙和剪紙
語文推理 數(shù)量推理
I詞匯 I算術
(小年齡,7歲上) II數(shù)列關系
II理解 III等式
III謬誤
IV語文關系 共15個分測驗
3.S-B測驗的特點
I. 內(nèi)容上含概了更廣的知識能力與信息加工的能力。
II. 采取分量表的形式(而前之版為年齡量表),框架有很大變化。對能力的各個方面進行評價。
III. 保留了傳統(tǒng)的適應性測驗
IV. 除了給總智商外,還有四個方面的分數(shù)及更多分支詳細。
使用范圍:2歲半~成人 適于找出弱智或超常兒的人。
4.測驗的實施與評分
先測詞匯分測驗,以其成績及年齡決定起測點。停測點因卷而易。采取一邊操作一邊評分。評分多是"0/1計分"。每個分測驗的分數(shù)相加(即:原始分數(shù),轉(zhuǎn)換成標準量表分把分測檢量表分相加),查常模,得四個量表分。再把四個分相加得總智商。
二. 麥卡錫幼兒智能量表(2歲半~8歲半)
(1972編)
1. 特點:
I. 測驗材料起點低,近似玩具。
II. 不受民族、地域文化差異的影響。
III. 年齡范圍側(cè)重于學齡期兒童。弱智兒童可用到14歲。
2. 構成
五個分量表。 十八個分測驗
總智商
語言 知覺操作 數(shù)量 記憶 運動
I.圖畫記憶 I.積木 I.數(shù)的問題 (把其他四部分 ( 眼、手
II.語詞知識 II.拼圖 II.數(shù)字記憶 與記憶有關的 的動作)
III.語詞記憶 III.連續(xù)敲擊 III.計數(shù)和數(shù)的區(qū)分 測驗組合在一起)
IV.詞語流暢性 IV.左右方向
V.反義類推 V.圖形臨摹
VI.畫人
VII.概括歸類
3. 評分
原始分數(shù)。查表,每分量表的分數(shù)相加,得合成粗分。
智商把前三部分的合成粗分相加得智商。還可評判"一側(cè)性"(或叫"單側(cè)化")單側(cè)化的完成也意味著智力的發(fā)展。
三. 瑞文測驗(Rowen)
漸進矩陣 A B C D E 60題 標準型
A B C D36題 彩色型-用于幼兒及弱智兒童
I
高級型
II
標準型+彩色型→聯(lián)合型 5歲~75歲
A套:簡單類比、直接辨別
B套:簡單推理
8歲以前只做A.Ab.B三套即可。
C套:單維推理(數(shù)量、位移、組合)
D套:二維推理
E套:套合、互換
特點:無文化差別的問題,可用于大規(guī)模篩選。
四. 韋克斯勒智力量表。
1. 發(fā)展:紐約貝勒維精神病院中,雛形,因為韋克斯勒認為:
比納量表的常模不適于成人。
智商術法不適于成人。
智商并不能完全反映智力。
韋克斯勒提出離差智商
兒童量表:WISC,WISC-R(修訂版)
WISC-Ⅲ
成人量表:WAIS,WAIS-R
學齡前及學齡初兒童量表(4.5歲-6.5歲)WPPSI,WPPSI-R
2. WISC-R簡介
全量表
語言量表 操作量表
語言量表
分測驗:
I. 常識(生活常識-檢查對日常事物的認知能力一般知識)
II. 類同
III. 算術
IV. 詞匯
V. 理解
VI. 數(shù)字廣度[備用替代](智力有問題,順背不超過5個,倒背不到3個)
操作量表
I. 填圖
II. 圖片排列
III. 積木
IV. 拼圖
V. 譯碼
VI. 迷津←(備用/替代)
原始分查表,相加得分量表分,再相加,得全量表分。
1991年修訂版
總智商
言語理解 知覺組織 注意集中 加工速度
(常識,類同、(填圖,圖 克服分心(譯碼、符號搜索)
詞匯、理解) 畫排列,積(算術,
木,拼配) 背數(shù))
另配:
成績測驗:用于學力能力、策略上有困難的學生(智商不低)
五. 考夫曼兒童成套評估測驗(2 1/2歲~12 1/2歲)
Kanfman Assessment Battery for Children(K-ABC)
以Das的PASS模型為依據(jù)
設想效果:從認知心理學與神經(jīng)心理學角度測量智力,不僅測量已有知識水平,而且測量解決新問題的能力。所得分數(shù)便于教育安排上的采用。
另,也有非語言量表
總量表
繼時性加工 同時性加工 成就量表 智力(-設想為解決
I.動作模仿 I.圖形辨認 I.詞匯表達 新問題的能力
II.數(shù)字背誦 II.人物辨認 II.人地辨認 流體智力(先天)
III.系列記憶 III.完形測驗 III.數(shù)字運用 智力量表分=
IV.圖形組合 IV.物體猜迷 繼時性加工的組分
V.圖形類推 V.閱讀發(fā)音 +同時性加工的得分
VI.位置記憶 VI.閱讀理解 (+非語言量表)
VII.照片系列 晶體智力(后天)
§4對智力測驗的反思的評價
1. 存在價值
2. 智力測驗的優(yōu)點
有標準化的過程——最大的優(yōu)點
比通過學業(yè)成就來評價智力要科學得多?!?br>I. 評價人的各種能力
II. 評價范圍廣
III. 快速、有效
3. 存在的問題與局限性
局限性表現(xiàn)在
I. 智商只提供量的數(shù)據(jù),而無質(zhì)的分析
II. 只測當時的智力,而不能考慮到以后的發(fā)展速度和趨勢
III. 標準答案有利于聚合思維、抽象思維和推理,而無利于發(fā)散思維
IV. 與文化教育有關,只能部分反映一個人的智力水平。(受理論局限)適應性行為也是智力的一部分。
V. 作智力測驗受很多因素影響(Eg:情緒、動機、疲勞etc)
4. 智力測驗的新理論與新方法。
I. 皮亞杰的發(fā)生認識論
重要的不在于對與錯,而在于怎么推理得到了結果。方法:綜合了觀察、測量、訪談etc,組合成了——臨床法。
II. 生態(tài)文化理論:
強調(diào)重視現(xiàn)時的環(huán)境、情景中人的智力活動。從各種社會環(huán)境中對智力進行評價。
第四章 學業(yè)成就測驗
(學績測驗、教育測驗)*特征與智力測驗相比的異用
旨在對學生在某一科目、某一知識中掌握的程度進行評價。
心理測驗中的學業(yè)成就測驗是標準化了的。
§1概述
一.發(fā)展
1.1894,Rice的拼字測驗揭開了標準化測驗的序幕
桑代克——教育測驗之父
(學生)Stune的算術測驗——最早的標準化的學科測驗
桑代克的書法測驗——第一個用科學方法編制的教育測量工具。
2. 性質(zhì):
學生對某一科目的學習效果,無預測功能。
3. 標準化測驗與白編測驗的不同之處。
I. 教師自編的測驗因教師的進展,班級的情況的不同而不同,易反映所在學?,F(xiàn)行的具體的教育目標;標準化中含有的教育目標更普遍。得到很多教育家的共識。
II. 標準化測驗重于理解、思維過程;自編的測驗重于具體知識。
二.成就測驗的類型。
1.(綜合)成套測驗
斯坦福成就測驗(幼級)
學術能力成就測驗
基礎教育及基本技能最低限度測驗
2.單科測驗
3.品質(zhì)量表
4. 教師自編測驗eg:作文(優(yōu)缺點)
要求:
I. 量多,范圍廣,覆蓋面大
II. 學生的回答形式越易越好
III. 要有客觀標準的評分方法
IV. 測驗形式多樣化
V. 盡量用要推理思考的題目,避免機械記憶
第五章 人格測驗(個性)
Eysenck Personality Questionnaive (EPQ)
艾森克個性問卷。
1752年 產(chǎn)生N分量表(神經(jīng)質(zhì))
1959年 E分量表(外傾性)
1964年 L分量表(說謊)
1975年 P分量表(精神質(zhì))
L量表值超過一定值之后,表明這份測量無效。
克雷普林,榮格。"聯(lián)想法"
武德沃斯
人格測驗的四種形式
一.自陳測驗--基本假設:人對自己最了解。忽略了:了解的正確性,報告的真實性
非自我描述,而是測驗,一般是紙筆測驗
采用是非題或選擇題
1.內(nèi)容消毒人格測驗(早期采用)
根據(jù)某一種人格理論,來確定要測量的一個特質(zhì)。
缺點:特質(zhì)與試題的聯(lián)系,過于明顯,容易使結果失真。
2.因素分析人格測驗
因素間相關較小。一個因素測一種特質(zhì)
eg:Y~G人格測驗
3.經(jīng)驗效標人格測驗
根據(jù)不同的人的反應來編制
eg:MMTI(明尼蘇達。。。)
用詞要盡量中性化
一般加入測慌題目
《卡特爾16種人格因素量表》
(一)根據(jù)"特質(zhì)理論"。特質(zhì)比習慣更一般化。
整個人格體系所包含的行為都可用語詞表現(xiàn)出來。通過因素分析,找到了15個因素:第二項B是從智力理論而來的。為第16個因素。
有ABC三個英文版,各187題。
(二)特點:1??陀^,明確,中性化的詞語
表面效度低,看不出測什么
編排
2.標準化。經(jīng)過三次抽樣,準確性高。測驗程序,抽樣都符合標準化。有部面圖
3.非單一功能,是多功能的
十六個因素組合,得次級得一些人格因素
4.廣普性。
用來評價正常人。16歲以上到老。
8歲到14歲用14P下(或CPQ)
5歲到8歲。還有一個量表。
5.多元性
信息量大。
(三)要求。1。每題都要選一個答案。
2.全部要回答
3.盡量做得快
4.少選折中得答案
《明尼蘇達多項人格文卷》
根據(jù)經(jīng)驗效標來測驗。
(一)編制思路和過程
1930~1940
收集1000多個題目,在效標組(異常人)和對照組(正常人)做實驗。為了測多項,要有許多效標組
10個臨床量表和4個效度量表(Q量表無專門題目)
13個分量表共654題。(有重疊得題目)。不重復,共550題,其中有16題可用兩次。
1至399題是測驗用,其他供研究用
(二)施測和評分。約45分鐘,一般不超過90分鐘
有:卡片式;問卷式
男女分開;把重疊的題的答案比較,不同的在6題以上,作廢;這些題與無法回答的題在30題以上,作廢。
疑病癥: T>60 不愉快,敵意,需求,同情
抑郁癥: T>70 表現(xiàn):易怒,膽小,自責
癔?。?nbsp; T>70 歇斯底里,天真,缺少自知力。用否認,壓抑來處理事情。
精神病態(tài) 高分 很難接受社會價值觀和社會道德規(guī)范易接受反社會行為。
外露,善交際,愛享受,不成熟,家庭關系處理不好,虛偽。
男子氣好氣。(非病)T越高,越遠離自己的性別 男:敏感,被動,愛美。(高分)
好攻擊,粗魯(低分)
女:(與男相反)
妄想癥: T>70 明顯精神病行為:認為自己受欺負--障礙
>80(極端) --精神病
∈[60,70] --傾向
精神衰弱 強迫行為,恐怖,刻板,自責,不安。
精神分裂 分裂的生活方式,退縮,膽小,心情易變,緊張,有奇怪的思想,判斷力差。
70~80 有幻想,幻覺
輕躁狂 T∈[70,75] 外露,樂觀,精力過分充沛,易怒,縱酒,輕浮,夸張,過高估計自己
>75 情緒反復無常
社會內(nèi)向(非?。?nbsp; 高分 內(nèi)向傾向嚴重
膽小,退縮,屈服,過于謹慎,反應慢
低份 外向,沖動,任性,做作,不太真誠
注:要根據(jù)雙高分的原則。 高:>60或70
(三)優(yōu)缺點
優(yōu)點:
(I) 客觀;與醫(yī)學診斷一致性高
(II) 首次把效度量表引入測驗
(III) 既可作醫(yī)學診斷,也可以作正常人的人格診斷
(IV) 豐富的題庫
缺點:
(i) 人格測驗信度不夠
(ii) 易受被試的年齡,性別,學歷,社會環(huán)境的影響
(iii) 對人格特質(zhì)的描述多用病理學解釋
(iv) 題目多,時間過長易引起煩躁。
二. 投射測驗
投射:個體把自己的思想,態(tài)度,愿望,情緒,性格等人格特質(zhì)不自覺地反映于外界事物或他人身上的心理作用。
特點:刺激本身沒有意義。
強調(diào)無意識,否認自陳測驗。
投射測驗的類型:
1.聯(lián)想法
詞的聯(lián)想(榮格)
羅夏墨跡圖 Rorschach Ink-Blot Test
2.構造法
根據(jù)被試看到的圖片,構造一個故事(有過去,現(xiàn)在,將來)。
主題統(tǒng)覺測驗 TAT
兒童主題統(tǒng)覺測驗:(i)動物版 (ii)人物版
3.完成法
提供殘缺不全的圖片或句子,要求補充完整
語句完成測驗(SSCT)60題(類:家庭,性,人際關系,自我觀念--
4.排選造
給予幾張照片,按(任何方法)某種順序排列
5.表露法
讓被試利用某種媒介自由表露心理狀態(tài)
畫樹測驗
20個標準
投射測驗優(yōu)缺點
優(yōu):(I)不受題目限制,可測出題目以外的線索,對人格做出綜合探索
缺:(I)評分缺乏標準,無常模,信效度不夠,不易量化理論深奧,對主試要求高,不易普及
三.評定量表(他評量表)
類型:
1.數(shù)字評定量表
2.圖標評定
3.標準評定
4.強迫選擇評定量表
四.情境測驗
1.品格教育測驗
主要用來測兒童的品格發(fā)展
(1) 誠實測驗。Eg:不肯能成績
(2) 自控測驗
(3) 公正測驗(多用于幼兒)
2.情境壓力測驗
eg:無領袖團體情境測驗
3.優(yōu)缺點:
優(yōu):在實際情境中做測驗,表現(xiàn)出來的人格特征較真實,準確。
缺:實施起來較困難,主試需經(jīng)過嚴格培訓。但仍有誤差。
四種人格測驗的缺陷
(i) 人格的定義還不一致。測驗內(nèi)容也不一致。所測的人格特質(zhì)也不相同。
(ii) 人格測驗的信度。效度較低。原因在于:人格受情境和個人當時心態(tài)的影響;人格測驗很難找到準確的效標。
(iii) 人格測驗編測題很難
(iv) 測驗結果的解釋有多樣性。答案無對錯之分。
(v) 測驗中有偽裝和社會贊許的反應。
(vi) 人格測驗關系隱私問題。
第六章 態(tài)度測驗法
社會心理學領域多用此測驗法。
一.態(tài)度的性質(zhì)及態(tài)度量表的公用。
1.基本性質(zhì)。
斯賓塞(Spencen)第一次用此詞。
Combell:態(tài)度是針對一組社會事物而產(chǎn)生的具有一致性的反應群。
三個層面:1.認知(尤其是評價性認知)
2.情感性。
3.行為傾向。
態(tài)度有方向性;也有強弱之分;有多面性;有三層面一致性。
2.態(tài)度量表:由一組相互有關聯(lián)的陳述句組成,一組態(tài)度語或項目。陳述句的方向,強度是有區(qū)別的。
明確的目的,測題質(zhì)量.數(shù)量是好的態(tài)度量表的決定因素.
3.功用
(1) 衡量一宣傳工具影響人們態(tài)度的程度.(或政治預測,市場調(diào)查,偏好)
(2) 評估教育的成果
二.等距量表法
1.根據(jù)研究主題,搜集符合的態(tài)度語100~200句.其中反對及贊成的比例1:1.(或1/3反對,1/3中立,1/3贊成).按反對到贊成份5~7組.
主義:語句通順,簡單;沒有歧義,每句句子對主體有清晰的態(tài)度.
公認的事實不要放在測驗中,無鑒別力.
2.請50~60人對反對至贊成的句子分組,至少7組(客觀,對主體明確的人)
3.對每名態(tài)度語做次數(shù)分布表和累積百分比表
4.畫累積百分比圖
5.找出(又值小的句子,并且在0~11組的分布合理.
1~4→3,5~7→4,8~11→3
三.利克特量表法(Likert)
1.針對一個研究主體,收集有關資料,編制成態(tài)度語(包括肯定的態(tài)度和否定的態(tài)度語).回答分五或六等題目及答案由肯定至否定得5,4,3,2,1分.
總加量表
特點
1)假定每一題都有相同得量值(因為題目要求同質(zhì)性)
(2)被試對題目得態(tài)度強度可以盡量分出等級.
2.編制方法
(1)項目的制訂 題目性質(zhì)相同
(若對不同質(zhì)題目的態(tài)度與對研究內(nèi)容的態(tài)度一致,則也可選用)
不少于20個
(2)預測和評分 選一樣組做預測,看題目是否編得理想
(預先測驗) (a值:內(nèi)在一致性)
(3)項目分析 分析題目的鑒別力
被試題目得分由高到低排列,取前后各25%人.
一個題目
高分中)(同意人數(shù)/高分組人數(shù))-(低分組中)(同意人數(shù))/低分組人數(shù))=鑒別指數(shù)
鑒別指數(shù):0.2以下淘汰,0.3以上通過.0.2~0.3修改
四.哥特曼量表法
1.構造原理
項目少(不超過10個),效果較好的一種量表,結構復雜.
每一題程度上有不同
eg:--戰(zhàn)場中的柑桔
經(jīng)常(a) 有時(b) 只有一次(c) 從來沒有(d) 不予回答(e)
(1) 心臟脈搏跳動很快
(2) 胃有下沉感
(3) 感到虛弱或暈眩
(4) 胃感到不適
(5) 出冷汗
(6) 嘔吐
(7) 全身顫抖
(8) 尿撒在身上
(9) 膀胱失去控制
(10) 有僵硬感覺
(2),(3)題中 a.b.c 一分 ;d.e 零分
其它題中 a.b零分 ;c.d.e 一分
去掉第(5)題
恐懼程度由弱到強:1~2~7~4~10~3~~6~9~8
一道題目:(理論上)
表(略)
2.步驟
(1) 設計句子,及五或六種反應態(tài)度
(2) 選一個代表性樣組進行預測
(3) 把題目按分數(shù)由上到下(從最贊成到最不贊成)排列
3.缺點。
只注重單向性,不注意設計項目。題目。
第七章 興趣測驗
一.1915.邁納(Miner) -- 不標準化的
1927 斯特朗(Strong)
1939 庫德(Kuder)
高中,高中以后。職業(yè)興趣才穩(wěn)定下來
(15歲~18歲)因為找被試有年齡限制。
可通過(i)興趣表達,(ii)對行為進行觀察,(iii)進行能力測驗(iv)興趣問卷,四個方法來了解個體的興趣。
(綜合以上三種方法,是最常用的)
只能說明有興趣,未必勝任。
二.《斯特朗~坎貝爾興趣問卷》
1. 評卷(I)瀏覽
(II)一般職業(yè)框架(轉(zhuǎn)換成七分)
低于34,此方面興趣很低
35~42 低
43~57 平均
58~65 高
高于66 極高
(III)對照常模
(IV)做一般解釋,也可再進行特殊分析
2.信度0.80
效度極好
三.庫德職業(yè)興趣調(diào)查表
強迫選擇
有48個大學專業(yè)量表
信度0.90
另外還有"個人匹配"??梢陨钊肓私庖粋€人的興趣
四.自我指導問卷
職業(yè)類型測驗 ~ 人格特點
職業(yè)搜索表
先測興趣特征,再根據(jù)人格特點查找興趣
再寫職業(yè)碼。查指南。
現(xiàn)實型(R),研究型(I),藝術型(A)
社會型(S),企業(yè)型(E),傳統(tǒng)型(C)
eg:心理 AIC
圖(略)
第八章 測量的誤差
穩(wěn)定性(一致性)
準確性
一. 誤差形式
(i) 隨機誤差
(ii) 常定誤差(系統(tǒng)誤差)--只影響準確性,而不影響穩(wěn)定性
(iii) 抽樣誤差
二.誤差的來源
1.測驗內(nèi)部引起的誤差(編制過程種,測題本身存在的誤差。)
題目取樣時,題量少,或無代表性
其他編制過程。Eg:句子意義不明確,題目太難,測驗時間設定不對
2.測驗過程中引起的誤差
a. 物理環(huán)境
b. 主試的情況(尤其對兒童會有影響)
步驟,說明被試是否清楚
兒童,或有情緒障礙的人需先交流
c. 意外干擾eg:團體測量中。
d. 計分過程中eg:不客觀,尺寸掌握不同
3.來自于被試本身的誤差
圖(略)
能力高的人不太會產(chǎn)生焦慮;能力不自信
求勝心切的人會產(chǎn)生較高;缺乏自信,適應性不強,情緒不穩(wěn)定的人易高焦慮
很少參加測驗的人,對程序不熟悉易高焦慮
測驗成績對被試而言很重要。易高焦慮
第九章.測量的信度
信度與隨機誤差的關系:信度大,誤差小
一. 信度的定義
實測分數(shù)=真分數(shù)+誤差
X=T+E
信度:真分數(shù)/實測分數(shù)(真分數(shù)不可能測得,只能通過對誤差的推測來估計)
判斷信度系數(shù)的高低:(能力測驗,信度需0.90,人格(態(tài)度)測驗,0.80)
一. 估計信度的方法
1. 穩(wěn)定系數(shù)(重測信度) 成人 隔2,3月至半年
皮爾遜積分相關公式 兒童 隔1,2周至半個月
r=(∑X1X2/N-#*#)/S1*S2 跨時間的一致性
2.復本信度(等值系數(shù))
跨形式的一致性。時間間隔不要太長。
3.內(nèi)在一致性。
跨題目的一致性
克倫巴赫a系數(shù):
(i) 分半信度:以奇偶數(shù)分半
r校正=(2*r分半)/(1+r分半
(ii) 庫德--理查遜估計法
K-R 20公式
Rkk=(k/(k-1))*((1-∑PiGi)/Sx2) --適用于二極性的答案
(iii) a=k/(k-1)*(1-∑Si2 /Sx2) --適用于二級以上的答案
內(nèi)在一致性優(yōu)點:只須做一次測驗,信度比以前兩種方式高。注:測驗是同質(zhì)性的或有分量表才可用。
4.因素分析。
5.評分者信度(主觀題)
三.影響信度的因素。
1.不同測驗范圍與信度
分數(shù)分布越大(誤差越?。?,信度高
eg:6~12歲,信度0.95,其中,10歲,信度<0.95
所以被試年齡多,信度易高。
2.測驗長度與信度
題目多,信度高
n=rnn(1-r11)/r11(1-rnn)
r11 原信度 rnn 目標信度
斯皮爾曼--布朗公式 K:改變以后的長度與原長度之比
rxx:原長度
r=Krxx /1+(k-1)rxx
3.測驗難度和信度
分數(shù)分散的分布越廣,信度越高
四.測量的標準誤差
尤其適用于解釋個人分數(shù)
標準誤差,誤差分數(shù)分布的標準差。
實踐中,以一組被試兩次測驗的得分代替一個被試多次測量的得分。
Se=St*(1-rtt)1/2
Eg:韋式測驗 Se=St*(1-rtt)1/2 =3.35
在95%的置信水平上,被試的區(qū)間。
3.35*1.96=6.6
若得分100,在[100-6.6,00+6.6]區(qū)間1概率為95%,也可用標準誤差判斷一名被試兩個測驗的差異
第十章 效度
信度只從測量角度評定測驗
效度:測測驗的特性的程度,測測驗是測什么特性。
&1.效度的概述
一. 什么是效度
一個測驗的結果必須符合測驗的目的。有效性效度相對信度更重要。
實測分數(shù)=真分數(shù)+誤差(隨機) 必要條件:信度,效度
效度:實測分數(shù)中與目的有關的真分數(shù)占實測分數(shù)的比例
二. 信度與效度的聯(lián)系
三. 影響效度的誤差來源
1.測題本身(最主要的來源)
測題長度,編排方式
2.實施過程中
3.被試的反應
四.效度的性質(zhì)
對效度的評價 高,中,低
效度通過推測得到
&2.準則關聯(lián)效度或效標效度
eg:智力水平的效標可以是:學習成績,教師評語,以后的成就
效標:相對的,
受時間的考驗
分:同時性
繼時性 eg:將來的工作成就
效度系數(shù)(測驗分數(shù)與準則的相關程度)
1. 相關法
a. 積差相關法 兩分數(shù)要求連續(xù)
圖(略)
b.二列相關法(一組分數(shù)連續(xù),另一組不連續(xù))
c.多元相關法(有多等級)
2. 區(qū)分法(小規(guī)模不易看出有差異,大規(guī)模易看出有差異)
3. 命中率
圖(略)
注意:以上三種方法都要求效標的可靠性
&3.內(nèi)容效度
一. 包含主要方面
各方面的題目要有比例,有一定難度
學業(yè)成就測驗尤其注重內(nèi)容效度
二. 考驗內(nèi)容效度的方法
1. 專家判斷
缺陷 (i)無量化指標
(ii)判斷不一致
(iii)由于教育思想不同,所以判斷內(nèi)容范圍時不一致)
2.統(tǒng)計分析法(克倫巴赫提出)
根據(jù)相同的內(nèi)容范圍,編兩套測題,對被試測試,再進行相關處理(類似復本心信度)
3.再測法
兩次測驗,后一次測驗分數(shù)明顯提高,則內(nèi)容效度高(中間有教學)
4.經(jīng)驗法
測驗分數(shù)隨年齡增長而提高,內(nèi)容效度高
三.內(nèi)容效度和表面效度的關系
被試或外行人從題目看出要測的內(nèi)容。兩者之間不要求同步。表面效度不是一種客觀指標,但會影響被試動機,從而影響內(nèi)容效度。學習成就,職業(yè)測驗,興趣測驗的表面效度高,人格測驗表面效度要低。表面效度降低只要改變措詞。
四.提高內(nèi)容效度的方法
編制命題雙向細目表
圖(略)
&4.結構效度
一. 概述
1954念提出
按一定理論編制測驗,測驗結果證明了理論,則有結構效度
二. 考驗結構效度的方法
1. 測驗內(nèi)方法
研究測驗的內(nèi)部結構,來界定測驗的結構范圍
(i) 借用內(nèi)容效度(結構效度與之有直接關系)
(ii) 考察測驗的同質(zhì)性
一個因素中的應是同質(zhì)性的,不同因素,之間不能是同質(zhì)性的。
(iii) 分析被試對題目的反應過程外來影響因素越小,結構效度越高
2. 測驗間方法
研究幾個測驗(同類)間的相關,來考察是否測同一特質(zhì)。
(i) 相容效度
求一個新測驗與一已有測驗的相關(若無已有測驗,用部分有關系的測驗代替)
(ii) 會聚效度和區(qū)分效度(1960坎貝爾提出)
要求:測同一特質(zhì)的變量有很高相關,并且,測不同特質(zhì)的變量有很低相關,特別適合于人格測驗。多種特質(zhì)--多種方法矩陣
3.準則關聯(lián)效度研究
對準則的預測水平越高,效度越高,主要看測驗分數(shù)可否區(qū)別不同的人。
Eg:Barron巴龍,自我強度量表
4.其他變它證據(jù)
隨自然事件的發(fā)生,測驗結果應有所變化
5.實驗操作
看是否受訓練的影響。Eg:學業(yè)成就--訓練有影響。智商-- 訓練無影響。非訓練測題。
證明了預期,則有效度
對效度的總結
(i) 任何測驗,都二要效度證據(jù)。不同測驗,偏重于不同種類的效度,實際運用中,多用準則關聯(lián)效度,內(nèi)容效度只需說明。
(ii) 三種效度有不同作用。
結構~:幫助我們運用分數(shù)去解釋人的不同心理特質(zhì)。
準則關聯(lián)~:了解分數(shù)是否可以有效估計某種行為表現(xiàn)
內(nèi)容~:幫助決定分數(shù)是否代表測驗結果。
(iii) 效度分析通常是編完測驗后做,但效度的思想已知影響編制過程。效度比信度更重要
第十一章 測驗的實施與計分
&1.測驗的準備
一. 測驗者的準備
主試的準備。經(jīng)過嚴格的訓練與考核,熟悉指導語。
二. 測驗環(huán)境的準備
1. 房間的選擇;2。桌椅安排。(不能太大,易分散主義;不能太小,不易施展開來。一般的光線,溫度,對兒童,引起注意分散的物品拿走)。位置遠離喧鬧,不準有人進出。(主試與被試中不可有一方站著,椅子太高或太低影響視線,桌子太小,傾斜都不能做測驗。不要坐沙發(fā),轉(zhuǎn)椅,應是直靠椅背的高度適中,桌面足夠大,不要太寬)
3.測驗材料的準備
4.參加測驗的人員
父母,班主任不可做主試
三.被試的準備。
放在被試最佳心理,生理狀態(tài)
1. 選擇的時間(無吸引他們的活動的時間,心理情緒穩(wěn)定,生理狀態(tài)良好的時候)
2. 生理的準備(在測驗時無急迫的生理需要)
3. 心理的準備,親密關系的建立
(i) 先介紹自己(姓名,職業(yè))
(ii) 問一些一般的信息,使他高興
(iii) 不直接地講一些"目的"。(避免提"作業(yè)")
(iv) 對大致的一些任務作介紹(所需時間,將有的活動,測驗的難度,鼓勵他們對不明確的地方立即提一些問題)
&2.測驗的實施
一.作記錄
1. 記錄要隱蔽
2. 記錄要真是
二.如何對待被試的要求
1. 如果被試沒有聽清題意,要求重復,一般允許,但記憶測驗不能重復
2. 如果被試要求修改回答,一般允許,但若規(guī)定只記第一時間的反應,則不允許更正。
三.對主試的要求。
1. 主試必須集中注意力
2. 不能對被試的回答有所暗示
3. 適當強化被試的行為(適當鼓勵)
4. 鼓勵被試的回答
5. 對磨棱兩可的答案,主試先重復回答,再讓被試解釋。若這類答案無論如何理解都錯,則不需追問。
6. 對計時題,題目說完就按下表
7. 計分嚴格按照手冊要求
&3.測驗的計分
一.年齡的計算法
測驗日期--出生年月
注:借位。有30日,12個月。。。
二.原始分計算法
1.0,1(對,錯)計分法
2.多級計分法
三.原始分換算為標準分數(shù)(以年齡分,以年級分,以百分位。。。來表示)
第十二章。測驗的項目分析
可以分:質(zhì)的分析。 專家對項目內(nèi)容,形式進行分析
量的分析。 采用統(tǒng)計方法來測定項目的品質(zhì)。
包括難度分析與鑒別力分析。
&1.項目的難度
一. 難度:測題的難易程度
難度分析 在能力測驗中,指:對測題難易程度作標定
在非能力測驗中,指:對內(nèi)容通俗性和流行性程度作分析在題目范圍之內(nèi),做回答的人的估計難度的指標。
1. 通過率--通過的百分比越高,題目越容易
(i) 二值記分測題:0,1計分
P=R/N(R:通過人數(shù),N:總?cè)藬?shù))
(ii) 非二值記分的測題
P=#/#max #實際的平均分 # max若都得滿分,所得得平均分。
但,先要做修正以排除"猜"得機率
即:再用校正公式 CP=(KP-1)/(K-1)(K代表"K擇一)
選項數(shù)目不一樣,不可直接比較兩題難度,要做校正。
(iii) 分組法
當被試樣本很大,把分數(shù)從高到低排列取高分組,上限27%人;低分組:下限27% P=(PH+Pz)/2(PH,Pz可用P=R/N 或P=#/#max 等得)
2.項目難度的等距量表
(通過率反映出的難度不等距)
二.測驗難度的確定和分數(shù)的分布
通過率越接近0或1,就無鑒別力;越接近0.5,越有區(qū)分力。
但每道題都是50%,一方面不太可能做到;另一方面,題目間的相關會很高。所以一般,把測驗的平均難度控制在0.5,而每道題可在0.3~0.7中波動
若選擇的人數(shù)少,參選的人多,則P可以很小,難度高一些,eg
可在0.05,當從100人中取5人時)
分數(shù)分布是常態(tài)的,測題難度就恰當。
反之, 圖(略)
&2.項目的鑒別力(區(qū)分度)
1. 鑒別力:測題對于不同水平的被試反應的區(qū)分程度和鑒別能力。
2. 鑒別力估計方式:
(1) 項目效度分析:主要依據(jù)效標,來考察測驗中的反應與效標的相關
(i) 可用相關系數(shù)
(ii) 用鑒別指數(shù):分數(shù)從高到低排列,對半分,分高分組,低分組。
小樣本時,D= PH - Pz 指數(shù)越高,鑒別力好。
大樣本時,用兩端來挑高分組,低分組 27%為最佳
(2) 有的測量效標難找,就用總分做效標,將每道題的分數(shù)與總分做相關
相關高;鑒別力也高;相關低,鑒別力不夠
計算方法:(i)點二列相關系數(shù)
rpbi=#p-#g/St(pg)1/2
#p答對的人的總分平均數(shù)(g=1-p)
#g 答錯的。。。。。。。。。。。。。
St標準差
P為難度值
條件:測題0;1記分,總分連續(xù)
(ii)二列相關
條件:測題與總分都是連續(xù)的值,測驗又認為分成兩類
rb=#p-#q/St(pg/y)1/2
(iii)積差相關
(3) 方差法 --看離散程度
一道題目,離散程度大,有區(qū)分度。
3.難度與鑒別力的關系
通過率為1或0,無鑒別力
通過率為0.5,鑒別力為1。
通過率為0.7,鑒別力最大值為0.6(書P124)
&3.項目分析實例
一. 步驟
1. 選取有代表性的樣組,按規(guī)定程序預測
2. 批出分數(shù)。按總分高到低排序,高分組,低分組各27%
3. 同一測題,高分組,低分組通過人數(shù)比率PH ,Pz
4. 分別求出難度,鑒別力
5. 比較高分組,低分組在每題答案上的反應。
6. 根據(jù)統(tǒng)計結果修改測題
二. 實例
題號 組別 選答人數(shù) 正確答案 難度 鑒別力
A B C D 未答 p rb D
1 高分組 5 92 1 2 0 B .71 .52 .42
低分組 22 50 12 16 0
2 高 58 10 15 16 1 A .42 .33 .32
低 26 21 15 36 2
3 高 17 15 28 28 12 D .31 .-.04 -.06
低 25 11 19 34 11
4 高 1 44 14 36 5 C .12 .08 .04
低 1 56 10 28 5
1. 首先看鑒別力
1, 2題號,3,4題淘汰或修改
2.難度(0.35~0.65之間最好,總難度要居中)
就難度而言,4個題都可使用
3.選答人數(shù)
異常:
(i) 正確答案無人或很少有人選,選的人數(shù)少于其他答案選的人;選錯的人過多
(ii) 高分組選正確答案的人少于低分組的,高分組選錯人多
(iii) 某一選項無人選擇
(iv) 未答人數(shù)較多
4.修改
&4.準則參照測驗的項目分析
以上的項目分析都是針對常模參照(與常模對照)測驗的。
1. 準則參照測驗是測接受訓練/教育的與不接受的人或接受前后一個人的差別。無常模,但有人為制定的標準。
準則參照測驗的難度取決于作為準則的東西。如果準則要求不高,難度可降低;標準高,難度就大。鑒別力同樣看準則,準則要求的內(nèi)容,鑒別力即使低,也要。
具體方法:
按成績分組,達到標準的一組,未達到的一組;計算兩族人對每題的差異。
差異:P=(PH + Pz )/N
鑒別力
=RH/NH-Rz/Nz N人數(shù)。R達到標準
2. 教育效果敏感指數(shù)(訓練效果)
實例:
學生 試題
1 2 3 4 5
前后 前后 前后 前后 前后
A +- -+ ++ —— +-
B ++ -+ ++ —— +-
C -+ -+ ++ —— +-
D -+ -+ ++ —— +-
E ++ -+ ++ —— +-
F —— -+ ++ —— +-
S1=0.5 S2=1 S3=0 S4=0 S5=-1
S∈[-1,1]大于0就有鑒別力,越大越好
&5速度測驗的項目分析
有人以答完此題的人數(shù)為指標,不考慮此題為做的人
也有人延長時間,但這忽略了速度因素的影響。
至今,未有很好的分析方法。
第十三章 量表和常模
&1.標準化樣組
預測的樣本可以較好地代表全域,則其為"標準化樣組"抽樣:
1. 選樣本時,要考慮到與測量有關地變量。Eg:智力測驗時,年齡要注意;地域;性別;父母學歷;家庭經(jīng)濟狀況
若全域中的小團體差異較大,則要分別制定常模
eg:人格測驗分男,女
2. 樣組規(guī)模要適當,有條件的化,越大越好。
3. 為了克服誤差,抽樣方法很重要
根據(jù)性質(zhì)和任務決定。
不能像調(diào)查一樣"愿者上鉤"
以"概率抽樣"將系統(tǒng)誤差減小到最小,誤差大小事無就可知。
(i) 簡單隨機抽樣
(ii) 分層抽樣。優(yōu)點
1)抽樣的分布反映總體的分布(2)分層抽樣誤差比(i)小;或誤差一樣,但花費較(i)少。
(iii) 整群抽樣。
隨機抽幾個整體(單位團體),其中的每個人都要進入調(diào)查得到的均數(shù)離整體較(i)更遠,所以為了避免此缺陷。樣本要大一些。一般,采取分層抽樣的方法(再在每一層,可用整群抽樣或簡單隨機抽樣。
&2.測驗的原始分數(shù)和導出分數(shù)
一. 原始分數(shù)(p136)
分數(shù)可以是任意的,沒有意義
修正 Xc=R+O/K
R:正確答對的題數(shù)
O:被忽略的
K:選項數(shù)
二. 量表分數(shù)
既有一定的參照,又有一定的單位。轉(zhuǎn)換后的分數(shù)稱為:"導出分數(shù)"。
1.百分量表
注:(i)原始分數(shù)轉(zhuǎn)換成量表分時,非線性。
原始分布成正態(tài),百分量表分呈長方形。
(ii)百分量表是等級量表,不能作加減運算。
2.標準分數(shù)(Z分數(shù))
要做運算時可用。是等距量表,把原始分與平均分的差以標準差來表示。
Z=(x-#)/S 注:原始分數(shù)的分布必須是常態(tài)的。是一種線性轉(zhuǎn)換
優(yōu)點:
(i) 可以做進一步統(tǒng)計分析,加減等運算
(ii) 可以對兩個以上的分數(shù)作比較
缺點:
(i) 計算,統(tǒng)計原理較復雜,不易使外行看懂,不能普及
(ii) 有負值,運用起來不方便;單位可能過大
(iii) 若原始分有問題,無法校正
3.常態(tài)化
原始分數(shù)~百分比數(shù)~Z分數(shù)
三. 標準分數(shù)的變化
1.7分數(shù)
以50為均數(shù),10為標準差。T=50+10Z
2.標準九
1,2,3,4,5,6,7,8,9
分為九個等級,5為均數(shù),2為標準差
相應百分比:4%,7%,12%,17%,20%,17%,12%,7%,4%
3.發(fā)展量表
年齡量表,年級量表
a.智齡。
三.剖面圖
使人們對測驗結果一目了然。
第十四章 編制測驗的方法
&1.測驗目的的確立和材料的選擇
一.測驗目的的確立
1. 把目標具體化
2. 測驗的對象確立(團體/個體)
3. 測驗的用途(善查/診斷。。。)
4. 類型(常模參照/標準參照)
5. 被試的文化背景
二.制定編制計劃(藍圖)
考慮測驗內(nèi)容,技能,重要程度(比重)
三.測驗材料的選擇
原則:1.取樣材料豐富,函概各放面
2.材料有普遍性,對全部被試公平
不同測驗還有不同原則。材料有趣(尤其對幼兒)
四.測驗形式的選擇
&2.測題編制技術
一.命題的一般原則
1. 測題內(nèi)容有代表性
2. 測題難度有一定的分布范圍
3. 測題的文字簡明,避免用深奧的詞(避免雙重否定)
4. 各測題之間要相互獨立
5. 正確答案只有一個(人格,創(chuàng)造力測驗除外)
6. 測題內(nèi)容不能超出被試的團體水平
7. 所提問題避免社會禁忌或個人隱私
策略:
(1) 先假定被試采取肯定態(tài)度,編題
(2) 假定問題,無所謂好壞
(3) 指出該行為不是異常的,而是普遍的
8. 測題數(shù)目比正式題目要多一倍,便于篩選
二.測題格式的種類
1. 自由反應型
(1) 是非題
猜對的可能大,因為標準化測驗中不用
注:
(i) 不能包含暗示,"所有""都"。。。有否定暗示
(ii) 一題只能包含一個概念
(iii) 題目表述簡潔,用正面陳述,不要用反面陳述或雙重否定
(iv) 選擇"是""否"數(shù)量差不多
(v) 測題不能太少,至少30~50題
(2) 選擇題
包含:詞干(詞句或不完整的陳述句),選項(4~5各)每題數(shù)目一致??煽疾?,記憶,鑒別,推理。。。
缺點:編幾個選項有難度,其間有關聯(lián)
注:
(i) 選項4~5各,且每題的數(shù)目一致
(ii) 錯誤選項不要太明顯,錯誤選項,高分組很少有人選,低分組有較多人選,錯誤選項被選到的概率要差不多。
(iii) 不要把選項放在詞干當中
(iv) 各選項在形式上要已知(eg:都是圖形,或數(shù)字符號。。。)
(v) 選項間不應相互重疊。
(vi) 選項中相同的詞可放在詞干中。
(vii) 選項中正確答案的位置隨機排列。
(3)匹配題
(i) 幾個題目內(nèi)容形式上一致
(ii) 知道語中講明匹配的依據(jù)
(iii) 配對項目不要太多,最多十對。
(iv) 同一項目不要印得分開來。用于測概念或事實間的盥洗1
(4)排列題
依據(jù)大小,時間。。。,將項目重新排列
(5)最好理由題
(6)聯(lián)想型
評判難把握。
&3.預測和測題分析
一.預測
目的:為了對測題進行修正
注:
(i) 預測對象即以后正式測驗要測的被試。人數(shù)不宜太多,也不能太少。一般,智力測驗要30人以上,學業(yè)成就測驗要370人左右。
(ii) 預測與正式測驗的程序是一樣的
(iii) 預測的時間可以放長(速度測驗例外)
(iv) 詳細記下被試的反應,記下完成的時間。記下可能產(chǎn)生誤解的題目。
二.測題分析(項目分析)
難度
鑒別力。區(qū)分等級越多越好
聚類分析。
把相似的內(nèi)容歸為一類。
因素分析
&4.測題的選擇,編排和測驗的標準化
步驟:
1.確定取舍標準
原則:(1)根據(jù)鑒別力 (2)再選難度適中的題目,特別難與特別容易的也要選一些(人格測驗等降低難度要求) (3)測驗長度也有要求1小時左右,測驗長度也取決于被試的年齡
2. 編排原則與方法:
一般在開頭有非常容易的題目
題目從容易到難,在測題最后放最難的題目。
編排形式:(i)并列直進式 -- 有分測驗
(ii)混合螺旋式 -- 無分測驗,純粹按難度 (優(yōu)點,被試不感到枯燥)
3. 測題性能的復核
再做一次預測
4. 編制復本 為了增加實用性
在難度上不能與原來有差別
"蛇"形排列。把所有題目按難度排好,標題號。
Eg: A版 1 3 5 …
B 版 2 4 6…
復本再做預測及分析。
5. 標準化
(i) 內(nèi)容方面的標準化 eg:A,B版題目等值。
(ii) 實施上標準化:規(guī)定統(tǒng)一指導語及時間限定。
(iii) 評分時標準化
&5.測驗基本特征的鑒定
信度,效度,量表,常模及指導手冊
第十五章 總結
心理測量的不足(失真)
1. 編制者依據(jù)的理論是否可以解釋所要測量的心理特性
2. 確定反應心理結構的行為樣組有局限,不夠全面
3. 預測的鑒定建立在概率論與統(tǒng)計上
4. 實施過程中的客觀影響不能反映被試的真是水平或態(tài)度。