이 포스트는 한빛미디어에서 출간한 '이것이 데이터 분석이다 with 파이썬'을 읽고 작성한 서평입니다.
책에서는 본 도서를 이론보다 '흐름'으로 제대로 배우는 데이터 분석 입무+실무 활용서라고 소개하고 있습니다.
입문자에게 중요한 것은 이론이나 스킬이 아닌, 문제에 올바르게 접근하는 '사고의 과정'이며, 그것을 위해 실생활과 밀접한 데이터를 [탐색] → [시각화] → [분석] 등의 단계별 흐름으로 설명합니다.
이 책에서 다루는 실행활 예제
- 우리나라는 술을 얼마나 독하게 마실까? - 국가별 음주 데이터 분석
- 그 선수의 내년 연봉은 얼마쯤 될까? - 프로야구 선수의 다음 해 연봉 예측
- 향후 5일 비트코인 시세 오를까, 떨어질까? - 비트코인 시세 예측
- 내가 볼 영화의 예상 평점은? - 영화 평점 예측
- 타이타닉 생존자들은 공통점이 있을까? - 타이타닉 생존자 특성 분석
- 맛집을 식별해주는 리뷰 키워드는? - 강남역 맛집 리뷰의 중요 키워드 분석
1. 접근성(읽기 편한 정도)
이론과 코드 해석이 전반적으로 균형감있게 작성되어 있으며 폰트, 줄간격, 문단 설정 등 가독성이 좋은 편입니다.
개인적으로 인라인으로 코드가 설명되는 것을 선호하는데 본 도서에서는 꼼꼼하게 주석처리 되어 있어 만족스러웠습니다.
2. 난이도(책 내용의 수준)
1독 후 느낌으로는 초급~중급(기본적으로 데이터를 볼 줄 알고 분석 결과를 활용해보려는 수준)의 분들에게 적합한 것 같습니다.
다양한 알고리즘을 비교하여 정확도를 높이기 위한 접근이 아닌 문제 해결을 위해 단계적으로 접근합니다.
3. 완성도(설명력)
부제로 적혀있는 "파이썬으로 배우는 데이터 분석 입문" 이 '너무 적절하다' 라고 생각될 정도로 분석 입문자를 위한 가이드가 잘 작성되어 있습니다.
분석 도메인에 따라 예제들을 제공하고, 도메인별 분석 주제에 대한 단계별 접근 및 풀이가 진행됩니다. 각 단계(EDA, 데이터 분석, 결과 해석)의 목적에 대해서 설명하고, 도출된 결과에 대한 해석과 그 풀이 과정에 필요한 실용적인 팁들을 제공해주어 분석 전체 과정을 배울 수 있게 구성되어 있습니다. 이후 미니 퀴즈, 리마인드 정리, 연습 문제를 통해 앞서 배운 학습 내용에 대한 복습 내용과 이해 수준을 한단계 높일 수 있는 연습 문제가 구성되어 있습니다.
다양한 분석 주제를 데이터 로딩부터 결과 해석까지 전체 과정을 배울 수 있어 실제 분석 업무 수행에 활용 가능할 것 같습니다.
4. 총평
개인적으로 이론 설명이 많은 교과서 같은 책 보단 실습이 많은 책을 선호하기에 기분 좋게 1독 할 수 있었습니다.
최근 캐글과 데이콘 같은 대회를 통해 분석에 대한 감을 잡고 실제 도전하는 모습을 주변에서 종종 보고 있습니다.
해당 도서에서 설명하는 절차 및 팁 들이 이런 대회를 시작하시는 분들에게는 많은 도움이 될 것 같습니다.
데이터 분석에 대한 감을 잡고 캐글, 데이콘과 같은 분석 대회에 도전해 보고 싶으신 분들에게 추천 드립니다.
5. 관련링크
- 동영상 강의 : https://www.youtube.com/user/HanbitMedia93
- 글쓴이 스트리밍 강의(Youtube) : https://www.youtube.com/channel/UCmWjmDlmMcuZ018xIHuh3iQ?guided_help_flow=3
- 글쓴이 블로그 : https://yamalab.tistory.com
- 도서 소스코드 : https://github.com/yoonkt200/python-data-analysis