데이터분석전문가(ADP) 19회 실기시험 후기

이번 포스트는 데이터 분석 전문가(ADP) 19회 실기 시험의 응시 후기 입니다.
지난 시험 후기(14회, 15회, 17회)는 아래 링크를 참고 하시면 됩니다.

1. 시험장 환경

  • 시험 장소는 서울 종로 '더조은컴퓨터아트학원 종로캠퍼스 신관' 이었습니다.
    • 대기실이 작아 거리두기를 하기 어려웠으며 응시자 분들이 옹기종기 모여 대기했었습니다.

2. 분석 환경

  • vmware로 구동된 RStudio Server에 크롬으로 접속하여 분석을 수행하였습니다.
    • R: R Studio Server
    • Python : Jupyter Notebook

3. 보고서 제출

  • 레포트 작성에는 WORD를 이용하였으며 깔끔함은 미뤄두고 코드 및 결과를 표에 우겨넣었습니다. ^^

    • 지난 시험에서 R Notebook을 이용하였다가 중간 프로세싱에 시간이 너무 낭비되는 것 같아 이번에는 심플하게 작성하였습니다.
  • 만약 R Notebook을 이용하여 레포트를 작성하실 예정이라면 전체 코드 완성 후에 R Notebook으로 레포트만 만드시는 걸 추천 드립니다.

Knite to HTML로 보고서를 만들면 가상환경 내에 .html 파일이 생성됩니다. Rstudio에서 export로 다운받아 크롬으로 열어본 후 PDF로 인쇄하시면 됩니다.

  • 최종 제출 레포트는 PDF 파일 1개를 제출해야 하며, 개인적으로는 R유저는 WORD를 사용하는 것이 가장 효과적이라고 생각합니다. (WORD를 이용하면 Jupyter Notebook과 같이 분석의 흐름대로 코드 및 결과를 작성할 수 있습니다.)
    • 이번에는 분석 레포트 외에 검증 데이터셋에 대한 예측 결과도 CSV파일로 제출하였습니다.

4. 문제 복기

이번 실기 시험에서는 크게 2가지 문제로 출제되었습니다.

1. 기계학습 문제 (고객 이탈 여부) (50점)

  1. 데이터 : 20개의 x와 1개의 y를 가지는 데이터로 y는 0과 1을 가짐
  2. 문제 :
    1. EDA 및 전처리
    2. 분류모델 3개 적용 및 Coufusion Matrix 출력
    3. 3개 모델 앙상블 모형 생성 후 예측값 저장
  3. 제출 : 분석 결과 PDF 제출, 예측결과 CSV 파일 제출

2. 시계열 데이터 분석 (주가 수익률 데이터) (50점)

  1. 데이터 : 날짜 및 주가 수익률 데이터로 Time-Series 변환 전 데이터 제공
  2. 문제 :
    1. 데이터 로드, 정상성/이분산성 검증
    2. 정상성 파악 근거에 따른 고정시계열 여부 파악
    3. SARIMA 분석 및 최적 모형 파라미터 선택
    4. 잔차 그래프 출력
  3. 제출 : 분석 결과 PDF 제출

5. 시험 후기

  1. 기계학습 문제는 기존 출제 유형과 유사하여 큰 어려움 없이 풀었습니다. 앙상블 모형 생성, 결과값 출력이 새롭게 출제되었는데 이 부분은 조금만 연습하시면 어렵지 않게 풀 수 있으실 거라 생각합니다.

  2. 시계열 분석 문제는 생각지도 못한 SARIMA 문제가 출제되어 정확하게 풀지 못했습니다. ARIMA 모형에 대한 지식을 기반으로 풀이 및 해석하였으나 정확한 답이 아니었는지 점수 획득을 못하였고 탈락하게 되었습니다.

  3. 이번이 3번째 실기 응시였는데 매 시험마다 문제 출제 방식에 대한 의문이 가시지 않습니다. (출제자 분들은 공식 수험서에 SARIMA 모형 설명이 있는지 확인을 해보셨을까요..)

  4. 복불복 난이도의 실기시험.. 응시자 분들은 좋은 결과 있으시길 바랍니다. ^^


ADP 자격시험을 준비하시는 모든 분들에게 존경을 표합니다. ^^