查看文章
統(tǒng)計(jì)學(xué)中的P值,“差異具有顯著性”和“具有顯著差異”
2009年09月18日 星期五 14:39
P值是論文中最常用的一個(gè)統(tǒng)計(jì)學(xué)指標(biāo),可是其誤用、解釋錯(cuò)誤的現(xiàn)象卻很常見。因此,很有必要說明p值的意義、用法及常見錯(cuò)誤。
P值指的是比較的兩者的差別是由機(jī)遇所致的可能性大小。P值越小,越有理由認(rèn)為對比事物間存在差異。例如,P<0.05,就是說結(jié)果顯示的差別是由機(jī)遇所致的可能性不足5%,或者說,別人在同樣的條件下重復(fù)同樣的研究,得出相反結(jié)論的可能性不足5%。P>0.05稱“不顯著”;P<=0.05稱“顯著”,P<=0.01稱“非常顯著”。
由于常用“顯著”來表示P值大小,所以P值最常見的誤用是把統(tǒng)計(jì)學(xué)上的顯著與臨床或?qū)嶋H中的顯著差異相混淆,即混淆“差異具有顯著性”和“具有顯著差異”二者的意思。其實(shí),前者指的是p<=0.05,即說明有充分的理由認(rèn)為比較的二者來自同一總體的可能性不足5%,因而認(rèn)為二者確實(shí)有差異,下這個(gè)結(jié)論出錯(cuò)的可能性<=5%。而后者的意思是二者的差別確實(shí)很大。舉例來說,4和40的差別很大,因而可以說是“有顯著差異”,而4和4.2差別不大,但如果計(jì)算得到的P值<=0.05,則認(rèn)為二者“差別有顯著性”,但是不能說“有顯著差異”。
由于“有顯著差異”和“差異具有顯著性”容易混淆,因而現(xiàn)在有些期刊提倡用“差異有統(tǒng)計(jì)意義”來代替“差異有顯著性”,用“差異無統(tǒng)計(jì)意義”、“差異有高度統(tǒng)計(jì)意義”來代替“差異不顯著”和“差異有高度顯著性”。例如《中華胃腸外科學(xué)》即是如此。
如果P>5%,是否我們就可以下結(jié)論說比較的二者沒有差別呢?不能。P>5%只能說明沒有充分的證據(jù)說明二者確有差別,但是也不能說二者沒有差別或差別很小。在這兩個(gè)極端之間還有一個(gè)過渡區(qū)間,即無論下有差別還是沒有差別或差別很小的證據(jù)都不足。要推斷二者沒有差別或差別很小,需要采用等效檢驗(yàn)的統(tǒng)計(jì)推斷方法。
統(tǒng)計(jì)縮略詞的含義:
ND not determined; NS not significant
.
統(tǒng)計(jì)學(xué)中的P值與顯著性的意義
轉(zhuǎn)載自
SPSS中文社區(qū),作者:xiaowenzi2
統(tǒng)計(jì)學(xué)意義(p值)
結(jié)果的統(tǒng)計(jì)學(xué)意義是結(jié)果真實(shí)程度(能夠代表總體)的一種估計(jì)方法。專業(yè)上,p值為結(jié)果可信程度的一個(gè)遞減指標(biāo),p值越大,我們越不能認(rèn)為樣本中變量的關(guān)聯(lián)是總體中各變量關(guān)聯(lián)的可靠指標(biāo)。p值是將觀察結(jié)果認(rèn)為有效即具有總體代表性的犯錯(cuò)概率。如p=0.05提示樣本中變量關(guān)聯(lián)有5%的可能是由于偶然性造成的。即假設(shè)總體中任意變量間均無關(guān)聯(lián),我們重復(fù)類似實(shí)驗(yàn),會發(fā)現(xiàn)約20個(gè)實(shí)驗(yàn)中有一個(gè)實(shí)驗(yàn),我們所研究的變量關(guān)聯(lián)將等于或強(qiáng)于我們的實(shí)驗(yàn)結(jié)果。(這并不是說如果變量間存在關(guān)聯(lián),我們可得到5%或95%次數(shù)的相同結(jié)果,當(dāng)總體中的變量存在關(guān)聯(lián),重復(fù)研究和發(fā)現(xiàn)關(guān)聯(lián)的可能性與設(shè)計(jì)的統(tǒng)計(jì)學(xué)效力有關(guān)。)在許多研究領(lǐng)域,0.05的p值通常被認(rèn)為是可接受錯(cuò)誤的邊界水平。
如何判定結(jié)果具有真實(shí)的顯著性
在最后結(jié)論中判斷什么樣的顯著性水平具有統(tǒng)計(jì)學(xué)意義,不可避免地帶有武斷性。換句話說,認(rèn)為結(jié)果無效而被拒絕接受的水平的選擇具有武斷性。實(shí)踐中,最后的決定通常依賴于數(shù)據(jù)集比較和分析過程中結(jié)果是先驗(yàn)性還是僅僅為均數(shù)之間的兩兩>比較,依賴于總體數(shù)據(jù)集里結(jié)論一致的支持性證據(jù)的數(shù)量,依賴于以往該研究領(lǐng)域的慣例。通常,許多的科學(xué)領(lǐng)域中產(chǎn)生p值的結(jié)果≤0.05被認(rèn)為是統(tǒng)計(jì)學(xué)意義的邊界線,但是這顯著性水平還包含了相當(dāng)高的犯錯(cuò)可能性。結(jié)果0.05≥p>0.01被認(rèn)為是具有統(tǒng)計(jì)學(xué)意義,而0.01≥p≥0.001被認(rèn)為具有高度統(tǒng)計(jì)學(xué)意義。但要注意這種分類僅僅是研究基礎(chǔ)上非正規(guī)的判斷常規(guī)。
所有的檢驗(yàn)統(tǒng)計(jì)都是正態(tài)分布的嗎
并不完全如此,但大多數(shù)檢驗(yàn)都直接或間接與之有關(guān),可以從正態(tài)分布中推導(dǎo)出來,如t檢驗(yàn)、f檢驗(yàn)或卡方檢驗(yàn)。這些檢驗(yàn)一般都要求:所分析變量在總體中呈正態(tài)分布,即滿足所謂的正態(tài)假設(shè)。許多觀察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現(xiàn)實(shí)世界的基本特征的原因。當(dāng)人們用在正態(tài)分布基礎(chǔ)上建立的檢驗(yàn)分析非正態(tài)分布變量的數(shù)據(jù)時(shí)問題就產(chǎn)生了,(參閱非參數(shù)和方差分析的正態(tài)性檢驗(yàn))。這種條件下有兩種方法:一是用替代的非參數(shù)檢驗(yàn)(即無分布性檢驗(yàn)),但這種方法不方便,因?yàn)閺乃峁┑慕Y(jié)論形式看,這種方法統(tǒng)計(jì)效率低下、不靈活。另一種方法是:當(dāng)確定樣本量足夠大的情況下,通常還是可以使用基于正態(tài)分布前提下的檢驗(yàn)。后一種方法是基于一個(gè)相當(dāng)重要的原則產(chǎn)生的,該原則對正態(tài)方程基礎(chǔ)上的總體檢驗(yàn)有極其重要的作用。即,隨著樣本量的增加,樣本分布形狀趨于正態(tài),即使所研究的變量分布并不呈正態(tài)。
========================顯著性差異 維基百科,自由的百科全書============
顯著性差異(significance level),是一個(gè)統(tǒng)計(jì)學(xué)名詞。它是
統(tǒng)計(jì)學(xué)(Statistics)上對數(shù)據(jù)差異性的評價(jià)。當(dāng)數(shù)據(jù)之間具有了顯著性差異,就說明參與比對的數(shù)據(jù)不是來自于同一
總體(Population),而是來自于具有差異的兩個(gè)不同總體,這種差異可能因參與比對的數(shù)據(jù)是來自不同實(shí)驗(yàn)對象的,如
比-西一般能力測驗(yàn)中,大學(xué)學(xué)歷被試組的成績與小學(xué)學(xué)歷被試組會有顯著性差異。也可能來自于
實(shí)驗(yàn)處理對實(shí)驗(yàn)對象造成了根本性狀改變,因而前測后測的數(shù)據(jù)會有顯著性差異。例如,記憶術(shù)研究發(fā)現(xiàn),被試學(xué)習(xí)某記憶法前的成績和學(xué)習(xí)記憶法后的記憶成績會有顯著性差異,這一差異很可能來自于學(xué)××記憶法對被試記憶能力的改變。
顯著性差異是一種有量度的或然性評價(jià)。比如,我們說A、B兩數(shù)據(jù)在
.05水平上具備顯著性差異,這是說兩組數(shù)據(jù)具備顯著性差異的可能性為95%。兩個(gè)數(shù)據(jù)所代表的樣本還有5%的可能性是沒有差異的。這5%的差異是由于隨機(jī)誤差造成的。
通常情況下,實(shí)驗(yàn)結(jié)果達(dá)到
.05水平或
.01水平,才可以說數(shù)據(jù)之間具備了顯著性差異。在作結(jié)論時(shí),應(yīng)確實(shí)描述方向性(例如顯著大于或顯著小于)。
如果我們是檢驗(yàn)?zāi)硨?shí)驗(yàn)(Hypothesis Test)中測得的數(shù)據(jù),那么當(dāng)數(shù)據(jù)之間具備了顯著性差異,實(shí)驗(yàn)的
虛無假設(shè)(Null Hypothesis)就可被推翻,
對立假設(shè)(Alternative Hypothesis)得到支持;反之若數(shù)據(jù)之間不具備顯著性差異,則實(shí)驗(yàn)的備則假設(shè)可以被推翻,虛無假設(shè)得到支持。
假設(shè)檢定