首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 整合移動平均自我迴歸模式(ARIMA)

整合移動平均自我迴歸模式(ARIMA)
AutoRegressive Integrated Moving Average model, ARIMA model
ARIMA為時間數列分析中常見的方法,由三部分組成,首先由自我迴歸(autoregressive, AR)與移動平均(moving average, MA)組成ARMA模式,再加入整合(integrated)成為ARIMA,使時間數列模式更具一般化(generalized)及完整性,其中整合亦指進行差分(difference)。 ARIMA主要處理具時間相依性的資料(依變數);例如,以年、季、月、週及日等時間週期記錄的資料。 若資料頻率以每日一次、每小時一次、每分一次或每秒、甚至小於秒為記錄單位,則稱高頻率資料,此類型資料通常有群聚(clustering)效應或在配適模式後其殘差具異質變異數, 此時建議改以廣義自我迴歸條件異質變異模式(generalized autoregressive conditional heteroskedastic model, GARCH) 分析。

本方法使用之R相關套件與參考文獻:
相關套件:stats、base、TSA、 forecast 、nortest
參考文獻:(依套件名稱排序)
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL: http://www.R-project.org/.
  2. Kung-Sik Chan and Brian Ripley (2012). TSA: Time Series Analysis. R package version 1.01. URL:http://CRAN.R-project.org/package=TSA
  3. Rob J Hyndman with contributions from George Athanasopoulos, Slava Razbash, Drew Schmidt, Zhenyu Zhou, Yousaf Khan, Christoph Bergmeir and Earo Wang (2014). forecast: Forecasting functions for time series and linear models. R package version 5.0. URL:http://CRAN.R-project.org/package=forecast
  4. Juergen Gross and bug fixes by Uwe Ligges (2012). nortest: Tests for Normality. R package version 1.0-2. URL:http://CRAN.R-project.org/package=nortest
範例F-1:

西元1970~1980年代我國經濟發展快速,中小企業林立,增加營收為公司企業首要的目標。由於各行業性質不同,公司營收易受外在因素的影響。例如遊樂園與線上遊戲公司在學生放寒暑假期間生意明顯較好;火鍋與冰品業之營收則受到季節與天候因素影響。對此,公司在經營策略上需有所調整。 某上市水泥公司總經理想了解公司的營收狀況是否受到特定時間、季節因素或公司人事支出的影響。例如,特定的時間與季節可能需要不同數量的聘雇人員來對應營運狀況,以及當較高的人事成本支出時是否能創造出較好的收入。 針對這些問題,該總經理請會計室收集了14年的月營收資料及該月的人事成本支出共165筆資料,資料內容為當月該公司的淨獲利與人事成本(單位千元), 資料列於下表

時間(月/年) 1/87 2/87 ... 9/100
月營收 161829 134109 ... 165211
人事成本 3727 3847 ... 3597

Q1:公司主管想了解該公司的月營收是否因不同月份或季節而有所差異?
問題解析:此處想了解月營收是否因不同月份或季節而有所差異,表示變數月營收與時間有關聯性,適合時間數列分析。
統計方法:問題中研究的變數為月營收;想了解其是否會因不同月份或季節的影響而有所差異?建議選擇時間數列分析中:整合移動平均自回歸模式(ARIMA),分析"月營收是否受月份或季節影響"。
整合移動平均自我迴歸模式(ARIMA) - 分析結果
  • 分析方法:整合移動平均自我迴歸模式(ARIMA)
  • 資料名稱:範例F-1
  • 依變數名稱:income
  • 變數轉換:不進行轉換
  • 模式配適:系統自動選取最佳模式
    • ARIMA(1,0,2) with non-zero mean

  • 資料預測:保留最後10筆資料
  • 計算時間:6.324秒

  • 基本訊息:
    • 時間數列圖:
    • ACF圖:
    • PACF圖:
    • 白噪音(平穩性)檢定:
      虛無假設:資料不為白噪音(資料不是平穩數列)
      D-F統計量I
      D-F statistic
      p值
      p-value
      -2.9377 0.1855
      I:Augmented Dickey-Fuller檢定

  • 模式配適:
    • 模式係數估計:
      係數
      coefficient
      估計值
      estimation
      標準差
      Std. err.
      t-統計量
      t-value
      p-值
      p-value
      INTERCEPT 241467.9673 37235.9411 6.4848 < 1e-04
      AR1 0.9372 0.0528 17.75 < 1e-04
      MA1 0.4991 0.097 -5.1454 < 1e-04
      MA2 0.2556 0.0836 -3.0574 0.0026
    • 模式配適訊息:
      σ2 1.581e+10
      AICI 4090.33
      AICcII 4090.73
      BICIII 4105.55
      Log likelihood -2040.17
      I:Akaike Information Criterion
      II:Akaike Information Criterion correction
      III:Bayesian Information Criterion
    • 實際值與配適值時間數列圖(藍色虛線為配適值):

  • 殘差分析:
    • 殘差時間數列圖:
    • 殘差常態機率分布(Q-Q)圖:
    • 殘差ACF圖:
    • 殘差PACF圖:
    • 殘差資料平穩性(stationary)檢定:
      虛無假設:資料不為白噪音(資料不是平穩數列)
      檢定方法
      method
      統計量
      statistic
      p值
      p-value
      擴充Dickey-Fuller檢定 -4.8868 < 0.01
      Phillips-Perron單根檢定 -151.3988 < 0.01
    • 殘差資料常態性(normality)檢定:
      虛無假設:資料服從常態分配
      檢定方法
      method
      統計量
      statistic
      p值
      p-value
      Shapiro-Wilk檢定 0.5017 < 1e-04
      Cramer-Von Mises檢定 3.7967 < 1e-04
      Shapiro-Francia檢定 0.482 < 1e-04
    • 殘差資料獨立性(Independence)檢定:
      虛無假設:資料互相獨立
      檢定方法
      method
      卡方統計量
      Chi-square statistic
      自由度
      d.f.
      p值
      p-value
      Box-Pierce檢定 0.0129 1 0.9094
      Box-Ljung檢定 0.0132 1 0.9085

  • 資料預測:
    • 預測值資料表:
      資料筆數真實值預測值絕對誤差百分比%I
      156386934349553.16639.6608
      157381705345037.71919.6062
      158234813338535.686844.1725
      159220891332441.847350.5004
      160177228326730.574684.3561
      161182413321377.851376.1814
      162149782316361.168111.2144
      163152432311659.4284104.458
      164171336307252.860579.3277
      165165211303122.933683.4762
      I:絕對誤差百分比 = |(真實值 - 預測值) / 真實值| * 100 %
    • 平均絕對誤差百分比%(MAPE):65.3%
    • 預測值與真實值比較圖(藍色虛線為預測值):
[重新分析]
範例F-1:

西元1970~1980年代我國經濟發展快速,中小企業林立,增加營收為公司企業首要的目標。由於各行業性質不同,公司營收易受外在因素的影響。例如遊樂園與線上遊戲公司在學生放寒暑假期間生意明顯較好;火鍋與冰品業之營收則受到季節與天候因素影響。對此,公司在經營策略上需有所調整。 某上市水泥公司總經理想了解公司的營收狀況是否受到特定時間、季節因素或公司人事支出的影響。例如,特定的時間與季節可能需要不同數量的聘雇人員來對應營運狀況,以及當較高的人事成本支出時是否能創造出較好的收入。 針對這些問題,該總經理請會計室收集了14年的月營收資料及該月的人事成本支出共165筆資料,資料內容為當月該公司的淨獲利與人事成本(單位千元), 資料列於下表

時間(月/年) 1/87 2/87 ... 9/100
月營收 161829 134109 ... 165211
人事成本 3727 3847 ... 3597

Q2:公司主管想了解該公司的月營收除了可能受時間季節性的影響外,是否也須考量人事成本?
問題解析:此處研究月營收是否受時間季節性與人事成本的影響?變數與時間有關聯性並加入一個帶有時間性的迴歸解釋變數”人事成本”,適合時間序列分析。
統計方法:建議選擇時間數列分析,採用整合移動平均自迴歸模式(ARIMA)分析方法。
整合移動平均自我迴歸模式(ARIMA) - 分析結果
  • 分析方法:整合移動平均自我迴歸模式(ARIMA)
  • 資料名稱:範例F-1
  • 依變數名稱:income
  • 自變數名稱:cost
  • 變數轉換:不進行轉換
  • 模式配適:系統自動選取最佳模式
    • ARIMA(1,0,2) with zero mean

  • 資料預測:保留最後10筆資料
  • 計算時間:6.688秒

  • 基本訊息:
    • 時間數列圖:
    • ACF圖:
    • PACF圖:
    • 白噪音(平穩性)檢定:
      虛無假設:資料不為白噪音(資料不是平穩數列)
      D-F統計量I
      D-F statistic
      p值
      p-value
      -2.9377 0.1855
      I:Augmented Dickey-Fuller檢定

  • 模式配適:
    • 模式係數估計:
      係數
      coefficient
      估計值
      estimation
      標準差
      Std. err.
      t-統計量
      t-value
      p-值
      p-value
      AR1 0.9384 0.0531 17.6723 < 1e-04
      MA1 0.4811 0.0962 -5.001 < 1e-04
      MA2 0.2851 0.0827 -3.4474 7e-04
      cost 61.7602 9.3117 6.6325 < 1e-04
    • 模式配適訊息:
      σ2 1.571e+10
      AICI 4089.41
      AICcII 4089.82
      BICIII 4104.63
      Log likelihood -2039.71
      I:Akaike Information Criterion
      II:Akaike Information Criterion correction
      III:Bayesian Information Criterion
    • 實際值與配適值時間數列圖(藍色虛線為配適值):

  • 殘差分析:
    • 殘差時間數列圖:
    • 殘差常態機率分布(Q-Q)圖:
    • 殘差ACF圖:
    • 殘差PACF圖:
    • 殘差資料平穩性(stationary)檢定:
      虛無假設:資料不為白噪音(資料不是平穩數列)
      檢定方法
      method
      統計量
      statistic
      p值
      p-value
      擴充Dickey-Fuller檢定 -4.8546 < 0.01
      Phillips-Perron單根檢定 -149.7347 < 0.01
    • 殘差資料常態性(normality)檢定:
      虛無假設:資料服從常態分配
      檢定方法
      method
      統計量
      statistic
      p值
      p-value
      Shapiro-Wilk檢定 0.5568 < 1e-04
      Cramer-Von Mises檢定 2.8888 < 1e-04
      Shapiro-Francia檢定 0.5376 < 1e-04
    • 殘差資料獨立性(Independence)檢定:
      虛無假設:資料互相獨立
      檢定方法
      method
      卡方統計量
      Chi-square statistic
      自由度
      d.f.
      p值
      p-value
      Box-Pierce檢定 0.0236 1 0.8778
      Box-Ljung檢定 0.0241 1 0.8767

  • 資料預測:
    • 預測值資料表:
      資料筆數真實值預測值絕對誤差百分比%I
      156386934324283.06216.1916
      157381705355943.42556.7491
      158234813328785.660640.0202
      159220891337044.087552.5839
      160177228324430.660483.0584
      161182413332363.467482.2038
      162149782320985.5988114.3019
      163152432316277.8394107.4878
      164171336329832.095692.506
      165165211285356.689872.7226
      I:絕對誤差百分比 = |(真實值 - 預測值) / 真實值| * 100 %
    • 平均絕對誤差百分比%(MAPE):66.78%
    • 預測值與真實值比較圖(藍色虛線為預測值):
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「雲端資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: