線性迴歸分析(Regression Analysis)
迴歸分析(Regression Analysis)可以分為簡單迴歸 Simple Regression 和複迴歸(多 元迴歸) Multiple Regression,簡單迴歸是用來探討 1 個依變數和 1 個自變數的關係, 複迴歸(多元迴歸)是用來探討 1 個依變數和多個自變數的關係,我們整理簡單迴歸和 複迴歸的表示式如下:
簡單迴歸表示式: Y = β 0 +β 1X1 + ε β 0 為常數,β 1為迴歸係數,ε 為誤差
迴歸分析的二大應用方向
- 有關解釋方面,我們可以從取得的樣 本,計算出迴歸的方程式,再透過迴歸的方程式得知每個自變數對依變數的影響力 (貢獻),當然也可以找出最大的影響變數,以進行統計上和管理意涵的解釋。
- 有關預 測方面,由於迴歸方程式是線性關係,我們可以估算自變數的變動,會帶給依變數的 多大改變,因此,我們使用迴歸分析來預測未來的變動。
迴歸分析的基本統計假設有下列四項:
線性關係
常態性(normality)
誤差項的獨立性
誤差項的變異數相等(Homoscedasticity)
檢定迴歸模式的統計顯著性(F test)
若 F>Fcrit:顯著性存在,推翻虛無假設,需要作進一步的檢定或解釋。
若 F≦Fcrit:顯著性不存在,接受虛無假設,研究者不需要作進一步的檢定,但 仍需要作解釋。
調整後的 R 2 (adjusted R 2 )
在迴歸模式中,R 2 會用來說明整個模式的解釋力,但是 R 2 會受到樣本大小的影 響而呈現高估現象,樣本愈小,愈容易出現問題(高估),因此,大多數的學者都採用 調整後的 R 2
共線性問題
查看相關係數,超過 0.8 就已經太高了,可能有共線性問題
查看容忍值(tolerance),容忍值 = (1- 自變數被其它變數所解釋的變異量), 容忍值( 0~1 之間),愈大愈好,容忍值愈大,代表共線性問題愈小,容忍值 的倒數 = 變異數膨脹因素 (VIF, variance inflation faction),VIF 的值愈小愈 好,代表愈没有共線性問題。
**當發生共線性問題時,我們可以採用 1.忽略高相關變數、2.只作預測,不作解釋 迴歸係數、3.用來了解關係、4.使用其它迴歸分析,來處理共線性的問題。
其他參考來源:
附件列表