Loading...

[R] 7. ARIMA (AutoRegressive Integrated Moving Average)

library(fpp3) #library(fable) Stationarity and differencing 정상성(Stationarity)과 차분(differencing) 정상 시계열이란? 통계적 특징들이 관측되는 시점에 의존되지 않는 시계열을 말합니다. 따라서 추세가 있는 시계열 또는 계절성이 있는 시계열들을 정상성이 있다고 보기 어려우며, 추세와 계절성은 다른 시점의 시계열 값에 영향을 줍니다. 차분이란? 연속적으로 측정된 관측치 간의 차이를 계산하는 것을 차분이라고 하며, 비정상 시계열을 정상으로 만들어 주는 방법 중 하나 입니다. 차분은 시계열의 추세와 계절성을 제거 또는 축소하여 시계열의 평균을 안정화하는데 도움이 될 수 있습니다. 관측치 간의 차이 간격 n에 따라 n차 차분이 있을수도 있으며,..

[R] 6. Exponential smoothing

library(fpp3) #library(fable) Simple exponential smoothing SES(Simple Exponential Smoothing)는 지수 평활화 방법 중 가장 단순한 방법입니다. 이 방법은 뚜렷한 추세나 계절적 패턴이 없는 데이터를 예측하는데 적합합니다. SES와 같이 나이브한 방법을 사용하면 미래에 대한 모든 예측값은 시계열의 마지막 관측값과 같습니다. 따라서 예측 시점을 기준으로 가장 최근의 관측치가 유일하게 중요한 관측치이면서 그 이전 관측치는 미래에 대한 정보를 제공하지 않는다고 가정합니다. 즉, 모든 가중치가 마지막 관측치에 주어지는 가중 평균으로 생각할 수 있습니다. \[\hat{y}_{T+h|T} = \frac{1}{T}\sum^{T}_{t=1}y_{t}\..

[R] 5. Time-series Regression

library(fpp3) #library(fable) The linear model \[y_{t} = \beta_0 + \beta_1 x_{t} + \epsilon_{t}\] 우리가 흔히 알고 있는 단순선형회귀 모형입니다. 이는 시계열 데이터에 적용할때도 마찬가지로 오차항에 대한 가정을 합니다. iid(independent identically distributed) 이를 fable 라이브러리 내 함수를 활용하여 살펴보겠습니다. 예시 데이터는 us_change로 tsibbledata 라이브러리 내에 있습니다. 1970년 1분기부터 2019년 2분기까지 미국의 개인 소비 지출(personal consumption expenditure)과 개인 소득(personal disposable income)의 분기별..

[R] 4. feasts

feasts feasts의 의미는 Feature Extraction And Statistics for Time Series의 약자라고 합니다. (FEASTS) 시계열 데이터 분석에 필요한 여러 가지 함수들을 제공하는 라이브러리 입니다. 시계열 분해, 추출, 시각화 등 Graphics: gg_season(), gg_subseries(), gg_lag(), ACF() 시계열 데이터의 패턴을 이해하기 위해 첫 단계로 시각화로 접근을 합니다. 먼저 gg_season() 함수를 사용하여 계절성(seasonality)을 확인해볼 수 있습니다. 예시로 tsibbledata 라이브러리 내 aus_production 데이터를 사용하겠습니다. 해당 데이터는 호주의 맥주, 담배 등 여러 품목별 생산지표 추정치에 관한 데이터..