Page 15 - MFB22陳宜楓
P. 15
此情況下就需要經過差分轉換處理後再進行單根檢定,直到該數列呈
現恆定狀態為止。
3.2 多元線性迴歸
線性迴歸是許多領域常見的統計分析方法,在解釋、個體預測、
趨勢預測上都處於一個重要的地位。不僅在經濟和財務上,社會科學、
工程、生物醫學等各方面都應用廣泛。其分析一個或多個自變
數 (independent variable) 與應變數 (dependent variable) 間的關
係,並對資料的分布狀態建立模型。使用此模型來描述變數之間相互
依存的關係,或是用來分析自變數對於應變數間的互相影響程度。而
多元迴歸分析在迴歸程序中,通常會有多個自變數與一個應變數,其
應變數是常態分布中互相獨立的隨機變量,自變數則以常態分布中的
隨機變量或是人為設定,其多元迴歸模型如下:
n
y j X , j t i ,
0
i
j 1
其中 i 1, ,n;而 y 是應變數第 i 個實際觀測值; X , j t 為第 j
i
個自變數的第 t 個觀測值; j 為多元迴歸模型中的估計係數,其
可能的數值範圍在 。 1 , , j 為多元迴歸模型的迴歸係
數,其可能的數值範圍 。 i 第 i 個觀測值的隨機變
數,也是隨機誤差 (random error)。
以多元線性迴歸模型計算出變數的估計係數前,我們需要先進
行變數的選擇,本研究使用統計軟體 R 語言中的 glmnet 函數庫,以
Lasso 模型來選擇重要的變數,並求得 Lasso 模型的參數估計
值。Lasso 模型是以 OLS 設計出來的,將 OLS 增加一個非線性的
限制最小平方法,得到的估計量雖然會有誤差 (bias),但在遇到解釋
變數很多時,係數的估計變異數會變小,使估計量的 MSE 比 OLS
估計量來得小。Lasso 模型能透過限制的條件,讓解釋力較差的係數
估計數結果為 0,藉此達到模型選取的目的。換言之,使用 Lasso 模
13