[도서리뷰] 한빛미디어 '데이터 과학을 위한 통계(2판)'

이 포스트는 한빛미디어에서 출간한 '데이터 과학을 위한 통계(2판)'을 읽고 작성한 서평입니다.

▲ '데이터 과학을 위한 통계(2판)' 표지

INTRO

본 도서에서는 데이터 과확을 위한 50가지 핵심 개념을 소개합니다. 데이터 분석에서 머신러닝까지 50가지 핵심 개념을 학습하면서 통계 지식통계적 사고력을 키우고, 필요한 이론을 적재적소에 활용하는 실력을 갖춘 데이터 과학자가 되는 것을 목표로 합니다.

주요 내용

  • 데이터 과학의 초석인 탐색적 데이터 분석 시작하기
  • 임의표본추출로 편향을 줄이고 고품질 데이터셋을 얻는 방법
  • 실험설계 원칙을 적용해 타당한 결론을 도출하고 명확한 답을 찾는 방법
  • 회귀분석으로 결과를 추정하고 이상을 탐지하는 방법
  • 범주를 예측하고 찾아내는 주요 분류 기법
  • 데이터로 학습하는 통계적 머신러닝 기법
  • 레이블 없는 데이터에서 의미를 추출하는 비지도 학습 기법

대상 독자

  • 통계학을 전공으로 공부하지 않은 데이터 과학자
  • 통계 이론을 몰라 어려움을 겪는 데이터 과학자
  • 필요한 이론적재적소에 활용하고 싶은 데이터 과학자
  • 일반인 대상의 통계책은 너무 쉽게 느껴지는 사람
  • 파이썬이나 R언어에 익숙한 사람

특징 1: 주요 용어, 개념 정리

각 챕터별로 용어 정리주요 개념 정보를 제공하고 있습니다.

용어 정리의 경우, 용어의 의미 뿐만 아니라 유의어 정보도 함께 제공하고 있습니다. 기본적으로 사용되는 용어들이 영어이다보니 번역하는 과정에서 유의어가 생기는데 용어 정리를 통해 학습자 분들의 혼란을 덜 수 있을 것 같습니다.

주요 개념은 각 챕터에서 설명하는 내용에 대한 추가적인 정보들을 제공합니다. 학습자의 이론 학습 이후 이해를 돕는 꿀팁이라고 생각하시면 됩니다.

▲ 용어 정리 예시 - 1

▲ 용어 정리 예시 - 2

▲ 주요 개념 예시

특징 2: R/Python 풀이 모두 제공

지난 1판 에서는 R언어 풀이만 제공되었었는데 이번 2판 부터는 동일한 문제에 대한 풀이를 R과 Python 모든 버전으로 제공합니다.

분석 상황에 맞춰 언어를 골라 사용하는 분들을 위한 배려로, 책을 보면서 개인적인 든 생각은 통계 분석에서는 아직 R이 더 유용하다는 생각이 들었습니다.

▲ R/Python 코드 예시

총평

▶ 주관적인 평점 : 4.5점 / 5.0점

개인적으로는 책을 일독하면서 그동안 어렴풋이 기억하고있던 통계 지식들을 다시 한번 학습할 수 있어 만족스러웠습니다. 다만, 2판 부터 제공되는 R/Python 동시 풀이는 편리하면서도 학습에 정보의 혼란이 생길수도있다는 생각이 들어 약간의 감점 요소라고 생각합니다.

후반부에서는 머신러닝(clssification, clustering)에 대한 내용을 담고 있어 ADP 실기시험을 준비하시는 분들에게는 참고 도서로 좋을 것 같습니다.

관련 링크

[1] 한빛출판네트워크(책 소개 페이지)