-
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (7) 시계열 분석자격증/빅데이터분석기사-필기 2021. 3. 25. 14:59728x90반응형
빅데이터분석기사 필기 요약
🔑 시계열분석/ 정상성/ 자기회귀모형(AR모형)/ 이동평균모형(MA모형)/ 자기회귀 누적 이동평균모형(ARIMA모형)/
백색잡음과정/ 분해시계열/ 추세요인/ 계절요인/ 순환요인/ 불규칙 요인
III. 빅데이터 모델링
02. 분석기법 적용
1. 분석기법
2. 고급 분석기법
2. 고급 분석기법
[3] 시계열 분석
(1) 시계열 분석 | 연도별/ 분기별/ 월별 등 시계열로 관측되는 자료를 분석 → 미래 예측
- 시계열로 관측 → x축 시간 & y축 관측값
- 추세를 분석 → 미래를 예측
- 시계열 데이터: 규칙적/ 불규칙적인 특징 가짐
(2) 정상성(Stationary) | 시점에 상관없이 시계열의 특성이 일정함
- 정상성을 만족해야, 시계열 분석이 가능함
- 정상성 조건: 평균 일정/ 분산&공분산이 시점에 의존하지 않음/ 공분산은 시차에만 의존함
- 기댓값과 분포가 시점에 따라서 달라지지 않는다면, 정상성을 만족한다고 할 수 있다~
(3) 시계열 모형 | 자기회귀모형(AR모형)/ 이동평균모형(MA모형)/ 자기회귀 누적 이동평균모형(ARIMA모형)
- 자기 회귀 모형 (AR모형) (Auto-Regressive Model)
- 현시점의 자료가 p시점 전의 유한 개의 과거 자료로 설명될 수 있다
- 과거 p번째까지의 데이터가 현재 데이터에 영향을 준다면 AR(p) 모형이다
- 관심있는 변수의 과거 값들의 선형결합을 이용하여, 자기 자신에 대한 미래 값을 예측한다
- 과거 관측값의 오차항이 미래 관측값에 영향을 준다 - 이동평균 모형 (MA모형) (Moving Average Model)
- 시간이 지날수록 관측치의 평균값이 지속적으로 증가 or 감소하는 시계열 모형
- 현시점의 자료가 p시점 전의 유한 개의 과거 백색잡음의 선형결합으로 표현된다
- 자신의 과거 값을 사용하여 설명하는 시계열 모형 → 정상 확률 모형/ 항상 정상성 만족 → 정상성가정 필요없음~
- 과거의 연속적인 오차항이 현재/미래 관측값에 영향을 준다
- [백색잡음(오차항)의 현재값] & [자기자신의 과거값]의 선형 가중합 - 자기 회귀 누적 이동평균 모형 (ARIMA모형) (Auto Regressive Integrated Moving Average Model)
- 분기/반기/연간 단위로 다음 지표를 예측하거나, 주간/월간 단위로 지표를 리뷰하여 트렌드를 분석한다
- 시계열의 비정상성을 설명하기 위해, 관측치간의 차분을 사용한다
- 비정상 시계열 모형 → 차분 or 변환 → AR or MA or ARMA 모형으로 정상화
- Integrated는 누적을 의미하는데, 차분을 이용하는 시계열 모형에서 이 표현을 씀~ - 백색잡음 (White Noise): 모든 개별 확률변수들이 서로 독립이고/ 동일한 확률분포를 따르는/ 확률과정을 말함 (I.I.D.)
- 백색잡음과정 (White Noise Process): 백색잡음과정 a(t)는 독립이고/ 같은 분포를 따르며/ 확률변수임 (평균 = 0)
자기 회귀 모형
AR(p)이동평균모형
MA(q)자기회귀 누적 이동평균 모형
ARIMA(p, d, q)자기 자신의 과거 관측값이 영향 줌
- Z(t) = 현재 시점 시계열자료
- Z(t-1) = 1시점 이전 시계열자료
- Z(t-p) = p시점 이전 시계열자료
- Φ(p) = p시점이 현재 시점에
영향을 주는 정도를 나타내는 모수 - a(t) = 백색잡음과정 = 오차항
자기 자신의 과거 오차항들이 영향 줌
- Z(t) = 현재 시점 시계열자료
- Z(t-1) = 1시점 이전 시계열자료
- Z(t-q) = q시점 이전 시계열자료
- θ(q) = q시점이 현재 시점에 영향
주는 정도를 나타내는 모수/가중치 - a(t) = 백색잡음과정 = 오차항
비정상 모형 → 차분으로 정상화
- p = AR모형과 관련있는 차수
- q = MA모형과 관련있는 차수
- d = 차분 횟수 (difference)
ARIMA에서 ARMA로 정상화할때
차분을 몇 번 했는가!
차수 p, d, q의 값에 따라서
모형의 이름이 달라진다~
< 차수 p, q > AR(1): 1차 자기 회귀 모형
바로 이전 시점의 자료만 영향MA(1): 1차 이동평균모형
같은 시점과 바로 이전 시점의
백색잡음의 결합- p = 0 이면, IMA(d, q) 모형
→ d 번 차분하면, MA(q) 모형 - q = 0 이면, ARI(p, d) 모형
→ d 번 차분하면, AR(p) 모형
< 차수 d > AR(2): 2차 자기 회귀 모형
과거 2 시점까지의 자료만 영향MA(2): 2차 이동평균모형
같은 시점과 과거 2 시점까지의
백색잡음의 결합d = 0 이면,
ARMA(p, q) 모형
정상성 만족!
- 분해 시계열: 시계열에 영향 주는 일반적인 요인을 시계열에서 분리하여 분석하는 방법 → 분해식 사용
- 회귀 분석적인 방법을 주로 사용함
⇒ 관찰된 연속형 변수들에 대해, 두 변수 사이의 모형을 구한 뒤 적합도를 측정하는 분석 방법 - 시계열 구성요소: 추세/ 계절/ 순환/ 불규칙 요인
- 회귀 분석적인 방법을 주로 사용함
< 분해식 >
구성요소 특징 예시 추세요인 (T) 어떤 특정한 형태 취함 선형적/ 이차식/ 지수적 형태 계절요인 (S) 고정된 주기에 따라 변화함 요일마다/ 월마다/ 분기마다 순환요인 (C) 알려지지 않은 주기에 따라 변화함 경제적/ 자연적 이유 없이.. 불규칙요인 (I) 설명할 수 없음, 오차에 해당함 추세/ 계절/ 순환요인으로 설명X
참고 도서: 빅데이터분석기사 필기_수제비 2021
728x90반응형'자격증 > 빅데이터분석기사-필기' 카테고리의 다른 글
[빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (9) 딥러닝 분석 (0) 2021.03.25 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (8) 베이지안 기법 (0) 2021.03.25 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (6) 범주형 자료 분석 (0) 2021.03.24 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (5) 군집분석 (0) 2021.03.23 [빅데이터분석기사 필기 요약] III.빅데이터 모델링 - 02. 분석기법 적용 (4) SVM, 연관성분석 (1) 2021.03.23