이 포스트는 한빛미디어에서 출간한 '파이썬을 활용한 베이지안 통계(2판)'을 읽고 작성한 서평입니다.
INTRO
데이터 분석에 입문하려는 분들에게 첫번째 고민은 바로 언어의 선택일 것입니다. 대부분 R or Python 중에 선택을 하게 될 텐데, 검색을 해보면 통계적인 분석에는 R이 강하고, 머신러닝/딥러닝 등 활용성이 좋은 건 Python 이라고 안내하고 있어 많은 분들이 좀 더 범용적인 Python을 선택하시는 경우를 많이 봤습니다. 이전에는 위 설명이 틀린것은 아니었으나
해당 도서에는 R 활용 없이 Python 자체 모듈/패키지들을 이용하여 베이지안 통계 분석을 수행하고 활용하는 방법에 대해 설명합니다. 아직 과거의 기억이 머물러있거나 Python의 한계라고 생각했던 통계 분석의 맛을 보고 싶으신 분들에게 추천드리는 책입니다.
책 소개
베이지안 통계를 마주하는 데는 프로그래밍으로 충분하다. 이 책을 읽고 나면 통계 문제를 수식 대신 파이썬 코드로, 연속 확률 분포 대신 이산 확률 분포를 사용해서 풀 수 있게 된다. 골치 아픈 수학 대신 프로그래밍을 통해 베이지안 기초 지식을 이해하고, 통계 기법 하나하나를 실생활 문제에 적용해보자.
베이지안 통계 기법이 더 보편화되고 더욱 주목받고 있지만, 초심자가 볼 만한 자료는 별로 없다. 이 책은 저자 앨런 B. 다우니의 대학교 학부 강의를 기반으로 한 계산 접근법으로 베이지안 통계에 순조롭게 접근하도록 도와준다.
대상 독자
- 파이썬이 익숙한 분
- 넘파이와 판다스를 아는 분
- 수학 없이 간단한 프로그래밍으로 통계를 익히고 싶은 분
주요 내용
- 프로그래밍으로 베이지안 통계를 배우고 이해하기
- 추정, 예측, 의사 결정 분석, 증명, 베이지안 가설 검정 등의 문제 살펴보기
- 동전, 주사위, 쿠기 그릇 등의 간단한 예제를 통해 이해하기
- 실생활 문제를 푸는 데 사용하는 계산법 익히기
목차
- 확률
- 베이즈 정리
- 분포
- 비율 추정
- 수량 추정
- 공산과 가산
- 최솟값, 최댓값 그리고 혼합 분포
- 포아송 과정
- 의사결정분석
- 검정
- 비교
- 분류
- 추론
- 생존 분석
- 표식과 재포획
- 로지스틱 회귀
- 회귀
- 켤레사전분포
- MCMC
- 근사 베이지안 계산
책을 읽고
▶ 주관적인 평점 : 3.5점 / 5.0점
해당 도서는 Python을 다룰 수 있는 분들을 대상으로 '베이지안 통계'를 활용하는 방법에 대해 설명합니다. 분석 언어로 R과 Python이 비교될 때마다 통계 분석 파워에서 항상 밀리던 Python이 이제는 보다 많은 부분을 커버할 수 있다는 가능성을 맛볼 수 있었으며, 기초 통계량부터 차근차근 설명하고 있어 초보자 분들도 쉽게 배우실 수 있을 것 같습니다.
관련 링크
[1] 한빛출판네트워크 - 파이썬을 활용한 베이지안 통계(2판)
[2] 소스코드 - 주피터 노트북 파일
[3] 소스코드 - 주피터 노트북 압축파일
[4] 연습문제 해답