Page 15 - MFB22陳宜楓

P. 15

此情況下就需要經過差分轉換處理後再進行單根檢定，直到該數列呈

現恆定狀態為止。

3.2 多元線性迴歸

線性迴歸是許多領域常見的統計分析方法，在解釋、個體預測、

趨勢預測上都處於一個重要的地位。不僅在經濟和財務上，社會科學、

工程、生物醫學等各方面都應用廣泛。其分析一個或多個自變

數 (independent variable) 與應變數 (dependent variable) 間的關

係，並對資料的分布狀態建立模型。使用此模型來描述變數之間相互

依存的關係，或是用來分析自變數對於應變數間的互相影響程度。而

多元迴歸分析在迴歸程序中，通常會有多個自變數與一個應變數，其

應變數是常態分布中互相獨立的隨機變量，自變數則以常態分布中的

隨機變量或是人為設定，其多元迴歸模型如下：
n
y     j X , j t   i ，
0
i
j 1
其中 i  1, ,n；而 y 是應變數第 i 個實際觀測值； X , j t 為第 j
i
個自變數的第 t 個觀測值；  j 為多元迴歸模型中的估計係數，其

可能的數值範圍在   。  1 , , j 為多元迴歸模型的迴歸係

數，其可能的數值範圍   。  i 第 i 個觀測值的隨機變

數，也是隨機誤差 (random error)。

以多元線性迴歸模型計算出變數的估計係數前，我們需要先進

行變數的選擇，本研究使用統計軟體 R 語言中的 glmnet 函數庫，以

Lasso 模型來選擇重要的變數，並求得 Lasso 模型的參數估計

值。Lasso 模型是以 OLS 設計出來的，將 OLS 增加一個非線性的

限制最小平方法，得到的估計量雖然會有誤差 (bias)，但在遇到解釋
變數很多時，係數的估計變異數會變小，使估計量的 MSE 比 OLS

估計量來得小。Lasso 模型能透過限制的條件，讓解釋力較差的係數

估計數結果為 0，藉此達到模型選取的目的。換言之，使用 Lasso 模

10 11 12 13 14 15 16 17 18 19 20