제 14회 ADP 실기를 준비해보자!!
여기저기 사이트를 돌아다니며 기출자료 정리중!
13회, 14회 실기시험에는 텍스트 마이닝 과목이 출제되지 않았습니다.
시험 전 공지사항을 참고하시어 착오 없으시길 바랍니다.
(참고 : 데이터분석전문가(ADP) 14회 실기 후기)
0. 주제 분류
- 통계분석
- 데이터마이닝
- 텍스트마이닝
1. 통계 분석
폐활량(Fev) 예측 문제 (나이, 키, 성별, 흡연 유무) - 2017.04.30
- EDA 및 상관관계 분석
- 적절한 회귀모형 선택
- 회귀모형 해석 (변수 별 증가에 따른)
- 평균 키, 나이(여자, 흡연자) 일 경우 폐활량 예측
통계 문석 문제 - 12회 기출
- 변수 시각화(변수간 상관관계, 변수별 이상치 파악)
- 회귀모형 적합과 유의성 검정
- 회귀 계수에 대한 standard error가 가지는 의미
- 회귀분석에서 잔차 분석 및 시각화
- 회귀분석에서 영향력 관측치와 그 영향 분석
2. 데이터 마이닝
백화점 사용패턴 분석 - 2017.04.30
Date (0000-00-00 00:00 형태) customer id product (한글 백화점 상품명) price (가격)
- 파생 변수 생성 및 EDA
- 군집분석 및 적절한 집단 갯수 설정
- 세그멘테이션 별 의미 파알 (집단 라벨링)
- 세그멘테이션 별 마케팅 인사이트 도출
고객 구매데이터 분석
- 고객 구매데이터(transaction data)에서 이후 1개월 간 실제 고객이 구매할 것으로 예정되는 지점 추천
- 5개 지점 추천 후 하나라도 맞으면 맞는 것으로 간주 적중률 66.7% 이상인 경우만 채점, 그 이하인 경우 0점으로 간주
타이타닉 데이터 분석
- 상세 없음
3. 텍스트 마이닝
TV Program Buz 분석 - 2017.04.30
- Tvprogram 파일에 있는 단어들을 사전에 추가하기
- Tvprogrambuz 파일을 읽고 데이터 전처리
- 월별/프로그램 별 나온 단어 분석
- 월별 프로그램 비율 확인
뉴스 기사 분석 - 12회 기출
- 뉴스기사 로딩 및 제공된 긍정/부정 어휘를 통한 감성분석
- 위에서 구한 긍정부정 score를 통해 N개의 그룹으로 클러스터링
영화 리뷰 분석 - 11회 기출
- 상세 없음