1936 年富蘭克林·迪拉諾·羅斯福(Franklin Delano Roosevelt)與艾爾弗雷德·蘭登(Alfred Landon)共同競選美國總統(tǒng)。此時,美國失業(yè)人數(shù)高達(dá)九百萬,在1929--1935這段期間實際收入下降了約1/3,經(jīng)濟正由大蕭條中逐漸恢復(fù)回升。蘭登競選主題為“小政府”口號為“揮霍浪費的人必須離任”“我們應(yīng)該專心致力于自己的事務(wù)”羅斯福競選主題為“擴大內(nèi)需”口號為“在我們能夠平衡聯(lián)邦政府的預(yù)算之前,必須先平衡美國人民的預(yù)算”。 絕大多數(shù)觀察家認(rèn)為羅斯福將毫不費力的獲勝,而《文學(xué)文摘》(literary Digest)雜志根據(jù)大約240萬人參加的一次民意測驗預(yù)測,蘭登會以57%對43%的優(yōu)勢獲勝。《文學(xué)文摘》的顯赫威望支持著它的預(yù)測,因為自1916年起,在歷屆總統(tǒng)選舉中該雜志都能正確地預(yù)測出獲勝的一方。實際的競選結(jié)果是羅斯福以62%對38%的一邊倒優(yōu)勢贏得了1936年的選舉,連任總統(tǒng)。
這是重要民意測驗曾作出過的最大誤差。接受民意測驗的人數(shù)這么多,但《文學(xué)文摘》這么大的預(yù)測誤差是怎么產(chǎn)生的呢?目前關(guān)于此問題的解釋集中在取樣策略方面。
1、取樣方法:郵寄1千萬份問卷,回收420萬份,但調(diào)查對象是從電話簿、汽車車主的登記資料以及選舉人的登記名單中選取。在經(jīng)濟大蕭條時期,電話和汽車并不像現(xiàn)在這樣普遍,當(dāng)時僅有1100 萬人擁有住宅電話,但900萬人失業(yè),僅針對擁有汽車和電話的少數(shù)人進(jìn)行調(diào)查并不具有代表性,但是這些名單比較容易得到。
2、取樣偏差(selection bias),取樣中包含過多的富人,而該年貧富間選舉傾向相距極大。那些富人支持共和黨的候選人,那些未能被調(diào)查的低收入民眾卻大部分支持民主的羅斯福,導(dǎo)致調(diào)查結(jié)果失真。 取樣有偏差時,再多的樣本也沒有用。
3、有回答或拒回答( non-response),或低回復(fù)率( response rate) 引起偏差。郵寄發(fā)出的調(diào)查問卷大約有1000萬張,但只有少數(shù)的調(diào)查表被收回,有效回復(fù)率僅為23%。在收回的調(diào)查表中,蘭登非常受歡迎。于是,該雜志預(yù)測蘭登將贏得選舉。以芝加哥為例,問卷寄給1/3 的登記選民,回收的20%的問卷,其中超過一半宣稱將選蘭登,但選舉結(jié)果卻是羅斯福拿到2/3的選票。對此,有的研究者認(rèn)為回復(fù)此項調(diào)查的樣本對象大都心存偏見,因為蘭登的
1948年蓋洛普及幾家大型民調(diào)公司對當(dāng)年的美國總統(tǒng)選舉結(jié)果卻做出了錯誤預(yù)測。民意調(diào)查結(jié)果顯示杜威會以5%或15%的優(yōu)勢領(lǐng)先競選連任的杜魯門,但選舉結(jié)果杜魯門卻以4.4%贏了杜威。學(xué)者分析這次選舉預(yù)測失販的原因,發(fā)現(xiàn)可能是:
1、民意調(diào)查訪問時間距投票日不夠接近,沒有現(xiàn)出杜魯門的聲勢己有起色。
2、采用的配額抽樣偏向容易接受訪問的群眾,達(dá)不到統(tǒng)計隨機取樣的要求。
3、沒有評估不表態(tài)民眾的可能投票傾向。
4、杜魯門的危機意識促使支持他的人踴躍投票,而杜威的支持者反之。
此后運用抽樣進(jìn)行民意調(diào)查的技術(shù)與方法,歷經(jīng)各種研究與修正,數(shù)十年來在美國歷次總統(tǒng)大選所做的民意調(diào)查的預(yù)測結(jié)果與大選結(jié)果幾乎都完全吻合。在抽樣時合理地使用隨機原理取得佯本,其應(yīng)用成效已深獲肯定與重視。當(dāng)前大多數(shù)應(yīng)用統(tǒng)計不會像前面的例子錯得那樣厲害,但在需要考慮選擇正確的樣本時,還是要非常謹(jǐn)慎小心。
――整理自(美)弗里德曼等著,魏宗舒等譯,統(tǒng)計學(xué),北京:中國統(tǒng)計出版社,1997 年P(guān)367-381.
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。