摘要:多元或多變量線性迴歸模型(multivariate linear regression model)是指多個因變量的迴歸模型。103(1): 39–40.)這篇文章中,作者分析了30篇聲稱使用了多元(multivariate)方法的文章,結果發現,其中只有5篇是真正使用了多元(multivariate)方法,主要是縱向數據(即重複測量數據),其餘25篇其實是多因素分析(multivariable analyses),主要是logistic迴歸。

內容來自: “小白學統計”微信公衆號,感謝作者授權。
在迴歸分析中,經常看到多變量回歸、多因素分析、多重線性迴歸、多元logistic迴歸等諸如此類的名詞。這些所謂的多變量、多因素、多重、多元,是否一回事?很多初學者都會比較迷惑,本文主要對此做一闡述。
迴歸分析中,主要就是因變量和自變量,大多數的迴歸模型的形都是如下所示:
因變量(或因變量的變換)=截距+迴歸係數*自變量(可以是多個自變量)
它反映了1個或多個自變量是如何影響因變量的。
因此,關於多變量、多因素、多重、多元,也就是如何對應因變量和自變量
爲了簡單起見,下面都以線性迴歸爲例來說明,其它如logistic迴歸、Poisson迴歸等都一樣。
(1)簡單(simple)線性迴歸
簡單線性迴歸模型(simple linear regression model)是指1個因變量、1個自變量的模型,如下:
(2)多因素(multivariable)或多重(multiple)線性迴歸
多變量線性迴歸或多重線性迴歸(multivariable or multiple linear regression)是一回事,是相對簡單線性迴歸而言。簡單線性迴歸只有1個自變量,多因素線性迴歸或多重線性迴歸則是有多個自變量。但它們都是隻有1個因變,模型如下:
(3)多元或多變量(multivariate)線性迴歸
多元或多變量線性迴歸模型(multivariate linear regression model)是指多個因變量的迴歸模型。
大家可以再對比一下多元方差分析和多因素方差分析。
多元方差分析或多變量方差分析,它們都是什麼意思呢?主要適用於像重複測量數據這種情況,在重複測量數據中,每個人測量了多次,有多個結局變量(因變量),因此是多元方差分析。
多因素方差分析主要用於什麼情形呢?通常用於有多個分組變(自變量),如析因設計中至少有2個分組變量,這種情況下,採用的是多因素方差分析。這裏的“因素”是指自變量,因此不是多元方差分析。
有些分類比較清楚的統計軟件,其實分的很清楚,尤其是一些菜單結構的。比如下圖是SAS jmp軟件的菜單,可以看出,在多元方法的菜單中,不是迴歸分析,而是主成分分析、因子分析、偏最小二乘迴歸等方法。

爲什麼呢?因爲迴歸分析除非特指,一般我們默認的都是1個因變量,但是自變量可以是1個或多個。而主成分分析、因子分析等這些方法,都是針對多個因變量的(不清楚的可以回去翻翻書),所以是多元方法。
在《Multivariate or Multivariable Regression?》(Am J Public Health. 2013; 103(1): 39–40.)這篇文章中,作者分析了30篇聲稱使用了多元(multivariate)方法的文章,結果發現,其中只有5篇是真正使用了多元(multivariate)方法,主要是縱向數據(即重複測量數據),其餘25篇其實是多因素分析(multivariable analyses),主要是logistic迴歸。有的文章中則是multivariate和multivariable在交互替代使用,把它們當做一回事。
由此可見,關於多重、多因素、多元、多變量等這些我們似乎每天都掛在嘴邊的名詞,其實並不是像我們想象的這麼簡單。即使在國際期刊,名詞混用的也大有人在。
希望通過本文介紹,大家以後可以區分這些基本概念,在文章撰寫時更加嚴謹。
當然,本文說的主要是醫學統計學中的一些區分,或許在有的領域並沒有區分這麼明顯。
因爲我有一篇文章,提到了多因素分析和多元分析的不同,結果有一位數理統計的老師給我的審稿意見是:在數理統計學中,多元(multivariate)就是多因素(multivariable),不用區分。我個人沒有在工科的學校學過,所以非常希望有數理統計老師明確告知,數理統計中,是否真的不區分這兩個概念?

由醫咖會與心聯喬治心臟健康研究中心(HHRC)聯合建立的心血管研究協作網絡及數據共享平臺(CDS)已經上線!

目前開放共享的數據爲“中國房顫註冊研究”,共有2.5萬多房顫數據,歡迎來申請使用數據,發表SCI論文!

平臺網址:

相關文章