[도서리뷰] 한빛미디어 '실전 시계열 분석'

이 포스트는 한빛미디어에서 출간한 '실전 시계열 분석' 을 읽고 작성한 서평입니다.

INTRO

통계를 전공했지만 시계열 분석은 감성적으로는 쉽게 느껴지지만 이론적으로는 항상 다루기 까다로운 분야입니다. 해당 도서에서는 통계와 머신러닝을 활용한 시계열 분석을 소개하면서, RPython 두 언어로 코드 풀이를 진행합니다. 시계열 분석에 대한 개념을 배우고, 시계열 데이터에 대한 감을 잡는데 좋은 책이며 깊은 이해를 원하시는 분들에게도 내용이 충분할 것이라고 생각합니다.

책 소개

실제 환경에 특화된 시계열 데이터 분석 및 모범 사례를 다루는 실무 지침서다. ARIMA베이즈 상태 공간 같은 표준적인 통계 모델과 계층형 모델을 폭넓게 다루고, 시계열 데이터 모델링의 현대적인 파이프라인 전체를 실용적인 관점에서 안내한다. 이 책에 담긴 통계와 머신러닝 기술을 활용하면 데이터 엔지니어링 및 분석 과제를 해결하는 방법을 익히고, 시계열 데이터의 핵심을 꿰뚫어볼 수 있는 시각을 얻을 수 있을 것이다.

practical-time-series-analysis-reviews
▲ 도서 추천사

주요 내용

  • 시계열 데이터 탐색 및 정리
  • 탐색적 시계열 데이터 분석 수행
  • 시간 데이터 저장
  • 시계열 데이터 시뮬레이션
  • 시계열 기능 생성 및 선택
  • 측정 오류
  • 머신러닝과 딥러닝을 활용한 시계열 예측 및 분류
  • 정확도 및 성능 평가

이런 독자를 위해

  • 시계열 데이터를 다뤄보지 않은 데이터 과학자
  • 실무 경험이 부족한 데이터 분석가
  • 시계열 데이터를 분석하거나 예측하는 통계학자 또는 경제학자
  • 대규모 데이터를 수집하는 기관에 소속된 비즈니스 관리자

이 책의 특징

1. 기초 및 이론부터 단계적으로 소개

  • 시계열 데이터 탐색 : 시계열 데이터의 탐색, 수집, 정리 등을 차근차근 배워나갑니다.
  • 시계열 예측 모델 구축 : 시계열 분석 대표 모델 ARIMA, VAR, AR 등과 딥러닝/머신러닝 모델 LSTM, RNN 등을 적용하여 시계열 데이터를 활용합니다.
  • 시계열 예측 생성 : MXNet과 텐서플로를 활용하여 실생활과 가장 밀접한 헬스케어, 금융, 정부 데이터의 연구 사례에 시계열 기법을 대입합니다.

2. 데이터 분석의 대표 언어 R과 Python 모두 제공

사용자 층의 다양성을 고려하여 R과 Python 두 언어를 사용한 풀이를 모두 제공합니다.

3. 다양한 예제로 살펴보는 시계열 분석, 머신러닝/딥러닝 모델

  • 한 대도시의 독감 연구 사례
  • 혈당치 예측
  • 금융 애플리케이션
  • 대규모 시계열 데이터 탐색

책을 읽고

▶ 주관적인 평점 : 4.0점 / 5.0점

서두에서도 이야기 하였지만, 시계열 데이터 분석은 난해한 분석과 해석 모두 난해한 부분이 많은 분야입니다. 일독을 하면서 깊은 이해는 못했지만 어렴풋이 알고있던 개념들이 정리되는 느낌을 받았고, 추후 시간을 내어 집중 학습한다면 레벨이 한단계 상승할 것이라고 기대하고 있습니다.


실생활의 대부분의 데이터가 시계열인만큼 기초를 탄탄히 하시고 발전시키신다면 분석가로서 큰 경쟁력을 가질 수 있을거라고 생각합니다.

관련 링크