이번 포스트는 데이터 분석 전문가(ADP) 19회 실기 시험의 응시 후기 입니다.
지난 시험 후기(14회, 15회, 17회)는 아래 링크를 참고 하시면 됩니다.
1. 시험장 환경
- 시험 장소는 서울 종로 '더조은컴퓨터아트학원 종로캠퍼스 신관' 이었습니다.
- 대기실이 작아 거리두기를 하기 어려웠으며 응시자 분들이 옹기종기 모여 대기했었습니다.
2. 분석 환경
vmware
로 구동된RStudio Server
에 크롬으로 접속하여 분석을 수행하였습니다.R
: R Studio ServerPython
: Jupyter Notebook
3. 보고서 제출
레포트 작성에는
WORD
를 이용하였으며 깔끔함은 미뤄두고 코드 및 결과를 표에 우겨넣었습니다. ^^- 지난 시험에서
R Notebook
을 이용하였다가 중간 프로세싱에 시간이 너무 낭비되는 것 같아 이번에는 심플하게 작성하였습니다.
- 지난 시험에서
만약
R Notebook
을 이용하여 레포트를 작성하실 예정이라면 전체 코드 완성 후에R Notebook
으로 레포트만 만드시는 걸 추천 드립니다.
Knite to HTML
로 보고서를 만들면 가상환경 내에.html
파일이 생성됩니다.Rstudio
에서export
로 다운받아 크롬으로 열어본 후PDF로 인쇄
하시면 됩니다.
- 최종 제출 레포트는 PDF 파일 1개를 제출해야 하며, 개인적으로는
R
유저는WORD
를 사용하는 것이 가장 효과적이라고 생각합니다. (WORD
를 이용하면Jupyter Notebook
과 같이 분석의 흐름대로 코드 및 결과를 작성할 수 있습니다.)- 이번에는 분석 레포트 외에 검증 데이터셋에 대한 예측 결과도
CSV
파일로 제출하였습니다.
- 이번에는 분석 레포트 외에 검증 데이터셋에 대한 예측 결과도
4. 문제 복기
이번 실기 시험에서는 크게 2가지 문제로 출제되었습니다.
1. 기계학습 문제 (고객 이탈 여부) (50점)
- 데이터 : 20개의 x와 1개의 y를 가지는 데이터로 y는 0과 1을 가짐
- 문제 :
- EDA 및 전처리
- 분류모델 3개 적용 및 Coufusion Matrix 출력
- 3개 모델 앙상블 모형 생성 후 예측값 저장
- 제출 : 분석 결과 PDF 제출, 예측결과 CSV 파일 제출
2. 시계열 데이터 분석 (주가 수익률 데이터) (50점)
- 데이터 : 날짜 및 주가 수익률 데이터로 Time-Series 변환 전 데이터 제공
- 문제 :
- 데이터 로드, 정상성/이분산성 검증
- 정상성 파악 근거에 따른 고정시계열 여부 파악
- SARIMA 분석 및 최적 모형 파라미터 선택
- 잔차 그래프 출력
- 제출 : 분석 결과 PDF 제출
5. 시험 후기
기계학습 문제는 기존 출제 유형과 유사하여 큰 어려움 없이 풀었습니다. 앙상블 모형 생성, 결과값 출력이 새롭게 출제되었는데 이 부분은 조금만 연습하시면 어렵지 않게 풀 수 있으실 거라 생각합니다.
시계열 분석 문제는 생각지도 못한
SARIMA
문제가 출제되어 정확하게 풀지 못했습니다.ARIMA
모형에 대한 지식을 기반으로 풀이 및 해석하였으나 정확한 답이 아니었는지 점수 획득을 못하였고 탈락하게 되었습니다.이번이 3번째 실기 응시였는데 매 시험마다 문제 출제 방식에 대한 의문이 가시지 않습니다. (출제자 분들은 공식 수험서에 SARIMA 모형 설명이 있는지 확인을 해보셨을까요..)
복불복 난이도의 실기시험.. 응시자 분들은 좋은 결과 있으시길 바랍니다. ^^
ADP 자격시험을 준비하시는 모든 분들에게 존경을 표합니다. ^^