国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
常見統(tǒng)計檢驗的本質(zhì)都是線性模型(或:如何教統(tǒng)計學(xué))下篇
本文轉(zhuǎn)載自統(tǒng)計之都,文章翻譯自  Jonas Kristoffer Lindel?v  的  Common statistical tests are linear models (or: how to teach stats),翻譯工作已獲得原作授權(quán)。本翻譯工作首發(fā)于統(tǒng)計之都網(wǎng)站和微信公眾號上。

7 比率:卡方檢驗是對數(shù)線性模型

回想一下,使用對數(shù)轉(zhuǎn)換可以簡單地處理比率(proportion),舉例來說, 每一個單位的增加,都會帶來  的一定數(shù)量的百分比的增加。借助這個特點,可以最簡單有效地理解計數(shù)數(shù)據(jù)和列聯(lián)表。


7.1 擬合優(yōu)度檢驗


7.1.1 理論:作為對數(shù)線性模型

模型:一個單獨截距來預(yù)測 log(y)。
我提議你參考閱讀列聯(lián)表一節(jié),基本上它就是雙因素擬合優(yōu)度檢驗

7.1.2 示例數(shù)據(jù)

本例子中,需要一些寬格式的計數(shù)數(shù)據(jù):
# Data in long formatD <- data.frame( mood = c('happy', 'sad', 'meh'), counts = c(60, 90, 70))# Dummy coding for the linear modelD$mood_happy <- ifelse(D$mood == 'happy', 1, 0)D$mood_sad <- ifelse(D$mood == 'sad', 1, 0)


7.1.3 R代碼:擬合優(yōu)度檢驗

現(xiàn)在,讓我們展示一下,擬合優(yōu)度檢驗其實是單因素方差分析的對數(shù)線性變換版本。設(shè)置 family = poisson() ,它默認使用 log 作為聯(lián)系函數(shù)(link function)(family = poisson(link='log'))。

# Built-in testa <- chisq.test(D$counts)
# As log-linear model, comparing to an intercept-only modelfull <- glm(counts ~ 1 + mood_happy + mood_sad, data = D, family = poisson())null <- glm(counts ~ 1, data = D, family = poisson())b <- anova(null, full, test = 'Rao')
# Note: glm can also do the dummy coding for you:c <- glm(counts ~ mood, data = D, family = poisson())
來看看結(jié)果:

注意,其中 anova(..., test = 'Rao') 表示用 Rao 得分 檢驗,又稱為拉格朗日乘子檢驗(Lagrange Multiplier test,LM test)來計算 p 值。當然也可以使用 test='Chisq' 或 test='LRT',它們計算近似的 p 值。你可能會認為我們在這里作弊了,偷偷地對卡方模型進行后續(xù)處理,實際上,anova 僅僅指定了 p 值的計算方式,內(nèi)部對數(shù)線性模型仍然發(fā)生在 glm 中。

順帶一說,如果只有兩個計數(shù)變量,而且樣本量較大(),模型會有效地近似于二項檢驗(binomial test) binom.test。這個樣本量比通常情況要更大,所以我認為這不是經(jīng)驗準則,也不會在此進一步探索。

7.2 列聯(lián)表


7.2.1 理論:作為對數(shù)線性模型

這里的理論會變得更令人費解,我會簡單地寫一下,從而你可以感受到它其實就是對數(shù)線性雙因素方差分析模型。來,開始探索……

對于雙因素列聯(lián)表,計數(shù)變量 yy 的模型使用了列聯(lián)表的邊緣比率來建模。為什么這是可行的呢?答案比較高深,我們不會在這里詳解,但讀者可以通過查閱 Christoph Scheepers 的相關(guān)幻燈片來獲得精彩的解答。這個模型包含了很多計數(shù)變量和回歸系數(shù) AiBi
yi=N?xi(Ai/N)?zj(Bj/N)?xij/((Aixi)/(Bjzj)/N)

多復(fù)雜呀?。?!這里, 是行標號, 列標號,Xsomething是相應(yīng)行和或列和的值:N=∑y。請記得, 是計數(shù)變量,所以  是總計數(shù)值。

我們可以通過定義比率 來簡化以上記號:αi=xi(Ai/N),βi=xj(Bi/N),αiβj=xij/(Aixi)/(Bjzj)/N。重寫模型如下:
yi=N?αi?βj?αiβj

嗯,好多了。然而,這里依然有很多乘法項,使得我們很難從直觀上理解變量之間是如何交互的。如果還記得 log(A?B)=log(A)+log(B),那么兩邊取對數(shù)就清晰易懂了,可得:
log(yi)=log(N)+log(αi)+log(βj)+log(αiβj)

太爽了!現(xiàn)在我們可以直觀地理解回歸系數(shù)(都是比率)是怎樣獨立地影響到  的。這就是為什么對數(shù)變換對比率數(shù)據(jù)如此有效。注意到,這其實就是雙因素方差分析模型加上一些對數(shù)變換,這就回到了所熟悉的線性模型———只是對系數(shù)的解釋發(fā)生了變化而已!此外,我們不能繼續(xù)使用 R 里的 lm 函數(shù)了。

7.2.2 示例數(shù)據(jù)


我們需要一些“長”格式的數(shù)據(jù),并且需要保存為表格格式,才能作為 chisq.test 的輸入:

Contingency data in long format for linear modelD <- data.frame( mood = c('happy', 'happy', 'meh', 'meh', 'sad', 'sad'), sex = c('male', 'female', 'male', 'female', 'male', 'female'), Freq = c(100, 70, 30, 32, 110, 120))
# ... and as table for chisq.testD_table <- D %>% tidyr::spread(key = mood, value = Freq) %>% # Mood to columns select(-sex) %>% # Remove sex column as.matrix()
# Dummy coding of D for linear model (skipping mood=='sad' and gender=='female')# We could also use model.matrix(D$Freq~D$mood*D$sex)D$mood_happy <- ifelse(D$mood == 'happy', 1, 0)D$mood_meh <- ifelse(D$mood == 'meh', 1, 0)D$sex_male <- ifelse(D$sex == 'male', 1, 0)


7.2.3 R代碼:卡方檢驗


接下來看看卡方檢驗和對數(shù)線性模型之間的等價性。這個過程和上述雙因素方差分析過程非常相似:
# Built-in chi-square. It requires matrix format.a <- chisq.test(D_table)# Using glm to do a log-linear model, we get identical results when testing the interaction term:full <- glm(Freq ~ 1 + mood_happy + mood_meh + sex_male +               mood_happy * sex_male + mood_meh * sex_male, data = D, family = poisson())null <- glm(Freq ~ 1 + mood_happy + mood_meh + sex_male, data = D, family = poisson())b <- anova(null, full, test = 'Rao') # Could also use test='LRT' or test='Chisq'
# Note: let glm do the dummy coding for youfull <- glm(Freq ~ mood * sex, family = poisson(), data = D)c <- anova(full, test = 'Rao')
# Note: even simpler syntax using MASS:loglm ('log-linear model')d <- MASS::loglm(Freq ~ mood + sex, D)
代碼里用了 summary(full),你可以取消以上代碼的折疊,查看回歸模型擬合的系數(shù)的原始值。作為對數(shù)線性模型,這些系數(shù)表示了:如果跳轉(zhuǎn)到一個類別的話,y將會獲得多少比例上的提升

8 資料來源和更多的等價模型

下面是本文內(nèi)容的部分資料來源,還包含了很多本文沒有提到的等價性模型:
  • Cross Validated 網(wǎng)站上,我的原始想法。

    https://stats.stackexchange.com/questions/303269/common-statistical-tests-as-linear-models

  • 對于“非參”檢驗,我之前提出的疑問和有用的答案。

    https://stats.stackexchange.com/questions/210529/are-parametric-tests-on-rank-transformed-data-equivalent-to-non-parametric-test

  • StackOverflow 網(wǎng)站上,關(guān)于 t 檢驗和方差分析的問題和回答。

    https://stats.stackexchange.com/questions/59047/how-are-regression-the-t-test-and-the-anova-all-versions-of-the-general-linear

  • Christoph Scheepers 的幻燈片,介紹了卡方檢驗如何被理解為對數(shù)線性模型。

    https://uni-tuebingen.de/fileadmin/Uni_Tuebingen/SFB/SFB_833/A_Bereich/A1/Christoph_Scheepers_-_Statistikworkshop.pdf

  • Philip M. Alday 的筆記,里面包括了卡方、二項、多項、泊松分布作為對數(shù)線性模型和 logistic 模型的理解。文中介紹的“等價性”沒有我在本文展示的那么精確,因此我沒有在本文詳細介紹。然而,它們對理解這些檢驗是有幫助的!

    https://rpubs.com/palday/glm-test

  • Kristoffer Magnusson  的文章使用 lme4::lmer 混合模型( mixed model )介紹了  RM-ANOVA  和增長模型( growth model )。

    https://rpsychologist.com/r-guide-longitudinal-lme-lmer

  • Thom Baguley 的文章介紹了 Friedman 檢驗。這篇文章實際上啟發(fā)了我開始思考“非參”檢驗的線性模型等價形式,而且最終推動我寫下了本文章。

    https://seriousstats.wordpress.com/2012/02/14/friedman/

9 教材和課程大綱

大部分高等統(tǒng)計書籍(和一些入門書籍)也都同意“所有模型都是 GLMM(廣義線性混合效應(yīng)模型) 的觀點”。然而,線性模型部分通常都是概念上提了一下,而沒有清晰地指出細節(jié)。我想通過簡練的方式把線性模型當作工具。幸運地,大部分對初學(xué)者友好的教材后來都合并了:

  • Russ Poldrack 的開源書籍 'Statistical Thinking for the 21st century'(從關(guān)于建模的第 5 章開始)

    http://statsthinking21.org/fitting-models-to-data.html

  • Jeff Rouder 的課程筆記,介紹了僅使用 R^2 和 BIC 來對比模型。它避開了所有關(guān)于 p 值、F 值等等的繁瑣問題。完整的材料和幻燈片。

    https://jeffrouder.blogspot.com/2019/03/teaching-undergrad-stats-without-p-f-or.html

    https://drive.google.com/drive/folders/1CiJK--bAuO0F-ug3B5I3FvmsCdpPGZ03

我說一下對我所做的事情的看法。我已使用了本文的一部分進行教學(xué),并獲得了巨大的成功,但是這并不是完整的教學(xué)過程,因為我并沒有分派到教授整個課程。
我會花費 50% 的時間在數(shù)據(jù)的線性模型上,因為它包含了學(xué)生所需知道的 70%(以下的第 1 點)。剩下來的課程則是關(guān)于當你有一個組、兩個組等等數(shù)據(jù)的時候會發(fā)生什么事情。

注意,主流統(tǒng)計課程的開始部分都是關(guān)于采樣和假設(shè)檢驗的理解;我這里把這部分移動到后面,這樣,學(xué)生可以基于之前學(xué)習(xí)的知識來進行理解,而不是一上來就面對各種陌生的概念。

  1. 回歸的基礎(chǔ)知識

    1. 回想高中的知識:

      然后獲得對斜率和截距的非常好的直覺。理解到這條式子能用所有的變量名稱來重寫:如 money = profit * time + starting_money或 
       或去除系數(shù)之后可寫成 y ~ x + 1。如果聽眾接受程度高的話,可以探索這些模型是如何解微分方程的,并指出 y 是如何隨著 x 的變化而變化的。

    2. 擴展到多元回歸模型。記得這時候要帶有非常多的生活例子和練習(xí),從而使這些概念變得直覺上非常容易理解。讓聽眾感嘆于這些簡潔的模型都可以用來描述非常大的數(shù)據(jù)集。

    3. 介紹對于非數(shù)值型數(shù)據(jù)如何進行秩轉(zhuǎn)換,并進行各種嘗試。

    4. 教授三種前提假設(shè):數(shù)據(jù)點的獨立性,殘差分布的正態(tài)性和方差齊性 (homoscedasticity)。

    5. 參數(shù)的置信(confidence)/可信(credible)區(qū)間。指出極大似然估計(Maximum-Likelihood estimate)很難計算,因此區(qū)間估計更為重要。

    6. 對以上簡單的回歸模型,簡要地介紹 R^2。順便提及一下,這就是 Pearson 和 Spearman 相關(guān)系數(shù)。

  2. 特殊情況 #1:一個或兩個均值(t 檢驗、Wilcoxon 檢驗、Mann-Whitney 檢驗):

    1. 單均值:當只有一個 x 值的時候,回歸模型簡化成了 y = b。如果 y 不是數(shù)值型的,你可以進行秩轉(zhuǎn)換。應(yīng)用模型假設(shè)(只有一個 x,因此方差齊性不適用于這里)。順便提及一下,這些僅有截距的模型也分別可稱為單樣本 t 檢驗和 Wilcoxon 符號秩檢驗。

    2. 雙均值:如果我們把兩個變量一起放在 x 軸,兩者均值之差就是斜率。很好!這就能用我們稱為瑞士軍刀的線性模型來解決。應(yīng)用模型的假設(shè)條件,檢查兩個組的方差是否相等,相等即方差齊性。這模型稱為獨立 t 檢驗。構(gòu)造一些例子,做一些練習(xí),也許還能加上 Welch 檢驗,再加上秩轉(zhuǎn)換 ---- 變成所謂的 Mann-Whitney U 檢驗的版本。

    3. 配對樣本:違反了獨立性假設(shè)。通過計算配對組的差值,這就轉(zhuǎn)化成了 2.1(單截距)的等價形式,盡管這種情況有另外的名稱:配對 t 檢驗和 Wilcoxon 配對組檢驗。

  3. 特殊情況 #2:三個或多個均值(方差分析(ANOVA))

    1. 對類別轉(zhuǎn)化后的示性變量類別的每一個取值范圍對應(yīng)的回歸系數(shù),是如何通過乘以一個二元(binary)示性變量,來對每個取值范圍對應(yīng)的截距來進行建模的。 ( How one regression coefficient for each level of a factor models an intercept for each level when multiplied by a binary indicator.) 這只是我們?yōu)榱耸箶?shù)據(jù)能用線性模型建模,而擴展了在 2.1 所做的事情而已。

    2. 一個變量的均值:單因素方差分析(one-way ANOVA).

    3. 兩個變量的均值:雙因素方差分析(two-way ANOVA).

  4. 特殊情況 #3:三個或多個比率(卡方檢驗)

    1. 對數(shù)變換:通過對數(shù)變換,把“多元乘法”模型轉(zhuǎn)化成線性模型,從而可以對比率進行建模。關(guān)于對數(shù)線性模型和對比率的卡方檢驗的等價性,可以查閱這個非常優(yōu)秀的介紹。此外,還需要介紹 (log-) odds ratio(一般翻譯為“比值比”或“優(yōu)勢比”)。當“多元乘法”模型使用對數(shù)變換轉(zhuǎn)化為“加法”模型之后,我們僅加上來自 3.1 的示性變量技巧,就會在接下來發(fā)現(xiàn)模型等價于 3.2 和 3.3 的方差分析----除了系數(shù)的解釋發(fā)生了變化。

    2. 單變量的比率:擬合優(yōu)度檢驗.

    3. 雙變量的比率:列聯(lián)表.

  5. 假設(shè)檢驗:

    1. 視為模型比較的假設(shè)檢驗:假設(shè)檢驗用于全模型和某個參數(shù)固定了(通常為 0,也即從模型中去除)的模型進行比較,而不是對模型進行估計。比如說,在 t 檢驗 把兩個均值之一固定為零之后,我們探究單獨一個均值(單樣本 t 檢驗)對兩個組的數(shù)據(jù)的解釋程度。如果解釋程度比較好,那么我們更傾向于這個單均值模型,而不是雙均值模型,因為前者更為簡單。假設(shè)檢驗其實是比較多個線性模型,來獲得更多的定量描述。單參數(shù)的檢驗,假設(shè)檢驗包含的信息更少。但是,同時對多個參數(shù)(如方差分析的類別變量)進行檢驗的話,模型比較就會變得沒有價值了。

    2. 似然比:似然比是一把瑞士軍刀,它適用于單樣本 t 檢驗到 GLMM 等情況。BIC 對模型復(fù)雜度進行懲罰。還有,加上先驗(prior)的話,你就能得到貝葉斯因子(Bayes Factor)。一個工具,就能解決所有問題。我在上文方差分析中使用了似然比檢驗。

10 不足之處

一些需要澄清的簡化前提:
  1. 我沒在這里覆蓋到前提假設(shè)的內(nèi)容。這會在另一篇文章揭曉!但是所有檢驗都很可能有三個預(yù)定假設(shè):a)  數(shù)據(jù)點的獨立性, b)  殘差的正態(tài)性, c)  同方差性(homoscedasticity)。

  2. 我假定所有的零假設(shè)是缺失了效應(yīng)的情況,但是所有原理都和非 0 的零假設(shè)所一致的。

  3. 我沒有討論推斷內(nèi)容。因為大家都會關(guān)心 p 值,因此我在比較中提到了 p 值,從而簡短地展示了背后的模型等價性。參數(shù)的估計值也會展示出相同的等價性。如何進行推斷則是另一個話題了。我個人是貝葉斯學(xué)派的,但是展示貝葉斯學(xué)派內(nèi)容的話,會減少這篇文章的受眾。此外,構(gòu)造穩(wěn)健模型是更好的選擇,但是它無法揭示模型的等價性。

  4. 本文列表依然缺失了很多其它著名的檢驗,有可能在以后添加進來。比如說符號檢驗(sign test)(要求很大的 N 從而可以有效地使用線性模型來近似),F(xiàn)riedman 檢驗 -- 即在 rank(y) 上的 RM-ANOVA,McNemar 檢驗,和二項(Binomial)/多項(Multinomial)檢驗。如果你認為它們需要在本文提及到,歡迎在本文檔的 Github 倉庫 提交對應(yīng)說明!

         Github:https://github.com/lindeloev/tests-as-linear/

11 附錄:翻譯稿評論

11.1 譯者評論

譯者:相對于統(tǒng)計檢驗來說,線性回歸實際上是更符合直覺的。想當年某檢驗實在讓筆者百思不得其解,某師姐指點迷津:“你實在搞不懂可以看成是線性回歸對系數(shù)的檢驗,我們?nèi)绱诉@般建造一個 X ……”讓筆者茅塞頓開。故聽朋友推薦本文之后,筆者毛遂自薦承接了翻譯任務(wù)。希望各位讀者能從本文感受統(tǒng)計的威力和它帶來的喜悅。如各位讀者有指正或建議之處,熱烈歡迎于主站或微信文下留言評論。

11.2 審稿人討論

審稿人:我(黃湘云)看完這篇文章的感受是懷疑自己讀了個“假”大學(xué),開個玩笑哈!感覺這篇文章是繼《心理學(xué)的危機》后又一篇需要找個地方安安靜靜讀幾天的,文中很多檢驗的細節(jié)都略過了,更加數(shù)學(xué)嚴格的檢驗介紹估計得去看《數(shù)理統(tǒng)計引論》陳希孺著的這本書才能明白。這篇文章的覆蓋面起碼是一個學(xué)期的課,如果把本文沒有詳述的其他檢驗補充進來,特別是加上檢驗的數(shù)學(xué)推導(dǎo)和一些實際應(yīng)用案例后,估計能成一本書。我是學(xué)線性模型的(此線性模型非大多數(shù)人了解的彼線性模型),看完之后有點汗顏和如夢初醒,驚奇于作者獨具一格的視角。不足之處是有些地方還不夠通俗,比如列聯(lián)表作為對數(shù)線性模型來理解,一點也不直接,作者也略去了!這里的列聯(lián)表其實是指我們通常教科書上的獨立性檢驗。擬合優(yōu)度檢驗和獨立性檢驗的檢驗統(tǒng)計量的極限分布都是卡方分布,故而都歸納在卡方檢驗下。

文章介紹了那么多的檢驗問題,實際上都可以歸為統(tǒng)計學(xué)三大檢驗 --- 似然比檢驗、 Wald 檢驗、(Rao)Score(得分)檢驗 --- 在線性模型下的特殊情況。數(shù)理統(tǒng)計的教材往往是利用似然比這把瑞士軍刀展開介紹的。似然比在假設(shè)檢驗中地位相當于極大似然估計在參數(shù)估計中的地位,相當于正態(tài)分布在抽樣分布中的地位。抽樣分布、參數(shù)估計和假設(shè)檢驗合稱統(tǒng)計推斷。學(xué)數(shù)理統(tǒng)計的人往往不愿去記那么多的檢驗名稱,比如 t 檢驗、F 檢驗和卡方檢驗,特別是諸多名人檢驗,因為本質(zhì)上那只是似然比統(tǒng)計量在不同的條件下呈現(xiàn)的極限分布不同而已。三大檢驗的漸近等價性可參考
  • Dennis D. Boos and L. A. Stefanski.  Essential Statistical Inference: Theory and Methods. 2013. Springer, New York. 

    Chapter 3. Likelihood-Based Tests and Confidence Regions.
  • Vito M. R. Muggeo and Gianfranco Lovison (2014) The “Three Plus One” Likelihood-Based Test Statistics: Unified Geometrical and Graphical Interpretations,  The American Statistician,  68:4, 302-306,  DOI: 10.1080/00031305.2014.955212


Rao 在 1948 年給出得分檢驗的漸近性,文中提及 Rao 得分檢驗這個名稱只是強調(diào) Rao 在得分檢驗中的貢獻,有些書籍中提及 Rao 檢驗基本等同于得分檢驗,而拉格朗日乘子檢驗由 Aitchison 和 Silvey 于 1958 年在經(jīng)濟學(xué)領(lǐng)域獨立提出來的,所以在統(tǒng)計學(xué)文獻中見最多的是得分檢驗,經(jīng)濟學(xué)文獻中多描述為拉格朗日乘子檢驗。這二者是殊途同歸,都對檢驗統(tǒng)計量的得分函數(shù)做泰勒展開,其極限分布都為卡方分布。

列聯(lián)表是分類數(shù)據(jù)的一種方便的組織形式,與之相關(guān)的檢驗和前面帶連續(xù)變量的線性回歸模型的檢驗是有本質(zhì)區(qū)別的,列聯(lián)表是與多項分布聯(lián)系起來的,這里沒有殘差,線性回歸模型往往對殘差做了獨立同正態(tài)分布的假設(shè)。

譯者簡介
黃俊文 ,本科中山大學(xué),碩士 University of California, San Diego?,F(xiàn)于業(yè)界從事數(shù)據(jù)分析工作。

作者:Jonas Kristoffer Lindel?v
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
R語音實戰(zhàn)筆記
回歸系列(一)| 怎樣正確地理解回歸
SPSS統(tǒng)計分析詳細結(jié)構(gòu)
谷歌新作:擴散模型背后的數(shù)學(xué)原理
探索性數(shù)據(jù)分析
使用eviews做線性回歸分析
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服