개인공부/statistics

시계열 데이터(Time series)- 정의, 구성, 특징, 종류

Bomme 2021. 4. 16. 08:10

시계열데이터 정의

  •   시간의 흐름에 따라 일정한 간격으로 기록된 데이터. 시간을 알고있는 최소 1이상의 데이터가 필요하다.

 

 *회귀분석과 비교( 시계열데이터와 달리 시간개념이 없음)

 

 

 

시계열데이터의 분류

 1)구성요인(component factors)

  •  추세(trend): 일정하게 증가 or 하락하려는 장기 변동
  •  순환(cycle): 불규칙적이고 반복적인 중기변동. 1년이상 (business cycle)
  •  계절(seasonal): 12개월(미만)의 주기를 가진 변동
  •  불규칙(irregular/random)

 1-2)구성요인 결합방식(composition)/ 시계열분해(decomposition)

  •  가법모형(additive model): 구성요인이 독립적이라고 가정. 더한다 
  •  승법모형(multiplicated model): 구성요인들이 독립적이지 않고 상호작용한다고 가정. 곱한다

 

  2)특성: 규칙/ 불규칙

  •  규칙패턴
  1.  자기상관(autocorrelativeness) 이전결과와 이후결과에서 발생하는 상관관계
  2.  이동평균(moving average): 이전에 생긴 불규칙한 사건에서 기인한 편향성
  •  불규칙패턴
  1.   화이트노이즈(white noise): 평균이 0, 일정한 분산, 정규분포에서 추출한 임의의 값이라고 설정 

 2-1)정상/ 비정상

  정상과정(stationary process) 시간이 지나도 확률적 특성이 유지) : ARMA, white noise

  비정상과정(non-stationary process) 시간이 지나면 분산이 커지는등 특성이 변화):  ARIMA

 

        

 

  시계열데이터 모델

- AR(autocorrealtion)-자기상관 : 평균으로 돌아가려는 성질. 

 

- MA(moving average)-이동평균: 시간에 따라 평균값이 지속적으로 증가하거나 감소하는 경향 ex)여름철 아이스크림판매량 

 

- ARMA(autogressive moving average)- AR+MA: 연구기관에서 가장선호

 

- ARIMA(autogressive integrated moving average)- ARMA(과거데이터 사용)+ 추세(momentum)      

   : correlation+ cointegration(시계열에서만 쓰이는 개념, 시점이 반드시 필요)

   : white noise 고려하지 않음(이상적인 모델엔 화이트 노이즈가 없으므로)

   : 자기자신의 integration만 고려

 

 

 

      

 

 

 

출처: m.blog.naver.com/bluefish850/220749045909

 

시계열 분석(Time Series Analysis)-모형

필자가 이전에 개괄에서 언급한 시계열의 한계에 대해서 이해했다면, 이제 간단히 시계열 정보를 접근하는 ...

blog.naver.com

출처: https://rfriend.tistory.com/509 [R, Python 분석과 프로그래밍의 친구 (by R Friend)]

출처: rosypark.tistory.com/51

 

시계열 데이터 정의와 시계열 자료 분석 방법 - 전통적방법

1. 시계열(Time series) 데이터란? 시간에서 순차적으로 (sequentially) 관측한 값들의 집합 독립변수(Independent variable)를 이용하여 종속변수(Dependent variable)를 예측하는 일반적인 기계학습 방법론에 대..

rosypark.tistory.com

 

출처: 단일 시계열 변수를 분석하는 방법 (ichi.pro)