이번 포스트는 2023년 데이터 분석 전문가(ADP) 및 준전문가(ADsP) 시험 일정을 공유합니다. 실기 기출 문제 정리 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 1. 통계 분석 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 2. 데이터 마이닝 & 기계 학습 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 3. 텍스트 마이닝 2023년 ADP/ADsP 시험 일정 2023년 데이터 분석 전문가/준전문가 시험 일정 및 기출 자료를 공유 드립니다. 데이터 분석 자격증(ADP)는 2021년 2,436명이 응시하여 최종 66명이 합격한 난이도 있는 시험입니다. (합격률 2.71%) 어려운 시험인만큼 외부의 시선도 높아지면 좋겠지만, 현실적으로 면접관 입장에서는 해당 자격증으로 판단하기 어려운..
해당 포스트에서는 RStudio 시작 시, 작업 환경이 자동 복구되는 기능을 옵션에서 조정하는 방법을 설명합니다. INTRO RStudio에서는 작업 환경의 연속성을 위해, 기본적으로 작업 종료 시 환경을 저장하고, 다음 작업에서는 이전 환경을 자동으로 불러올 수 있게 기능이 제공되고 있습니다. 하지만 작업 연속성이 필요없거나 이전 작업의 불필요한 메모리 사용이 있었다면 이러 기능은 일반 사용자 분들에게는 오히려 불편하게 다가올 수 있습니다. 아래에서는 RStudio 작업 환경 자동 복구 기능을 끄거나 키는 방법에 대해 설명합니다. 질문 Rstudio를 사용하고 껐다가 다음날 키면 전에 썼던 내용이 그대로 뜨는 이유는 뭔가요?? 어떻게 하면 다음날 켜도 전에 했던 것들이 안뜨나요?? 답변 RStudio는..
해당 포스트에서는 posit(formerly RStudio) Engineer가 발표한 'R 파일명을 정의하는 방법'에 대해 소개합니다. INTRO 파일명을 정의하는 방법에는 다양한 방법이 있고, 개인마다 스타일이 있습니다. 하지만, 분석가나 개발자의 경우, 기계가 좀 더 잘 이해할 수 있고, 분석에 좀 더 잘 활용할 수 있으며, 타인이 봐도 직관적으로 이해할 수 있는 스타일로 파일명을 정의하는 것이 생산성 및 효율성을 높이는 방법 중 하나라고 생각합니다. 아래에서는 posit(formerly RStudio) engineer인 Jennifer Bryan이 제안하는 파일명 정의 방법에 대해 정리 및 설명합니다. 좋은 파일 이름은... 좋은 파일 이름은 아래 3가지 기준을 충족해야 합니다. 기계..
해당 포스트에서는 R에서 데이터 프레임(Data Frame)에 있는 모든 숫자 데이터를 한 번에 '홀수'와 '짝수'로 변환하는 방법에 대해 설명합니다. INTRO R에서 사용되는 기본 자료형(Basic Data Types)은 총 5가지가 있습니다. 그 중에서도 수치형(numeric or integer)과 문자형(character)은 상대적으로 많이 사용되기도 하지만, 데이터 분석 과정에서 변환을 통해 데이터 특성을 다르게 고려해야 하는 경우가 종종 발생합니다. 아래에서는 네이버 지식을 통해 받은 질문 중, 데이터 프레임(Data Frame)에 저장된 모든 숫자를 한 번에 '홀수', '짝수'라는 문자로 변경하는 방법에 대해 설명합니다. 질문 내용 및..
해당 포스트는 R에서 사용자에게 점수를 입력받으면 학점(등급)을 계산하여 출력해주는 방법에 대해 소개합니다. INTRO 사용자에게 점수를 입력받고, 구간에 따라 학점(등급)을 출력해 주는 함수를 생성해 보겠습니다. 간단하지만 기초 단계에 배우는 사용자 입력, 조건문, 반복문까지 필요한 문제이기에 아래 설명을 참고하시어 기초를 이해하시고 활용해 보시면 좋을 것 같습니다. 질문 풀이 1. 문제 파악 먼저, 문제에서 제시된 조건들을 정리하면 아래와 같습니다. 0부터 100사이의 정수 값 입력받기 입력받은 정수를 학점으로 변환 for반복문을 이용하여 5회 반복 readline() 을 사용하여 사용자 입력 받기 입력받은 문자열을 숫자로 변경할 때 as.numeric() 함수 사용 4,5번 조건은 1번 코드를 작성..
해당 포스트는 R에서 행렬(matrix)을 리스트(list)에 저장한 후 특정 연산을 수행하는 방법에 대해 소개합니다. INTRO 행렬(matrix)은 R에서 많이 사용되는 데이터 프레임(Data frame)과 유사하여 데이터 조작이 낯설지 않으실 겁니다. 하지만, 리스트(list)에 저장된 행렬(matrix)을 조작하려는 경우에는 다른 코드 사용법을 알아야 하며 아래에서는 그 방법에 대해 설명합니다. 질문 풀이 1. 데이터 생성 문제에서 주어진 연산이 가능하도록 데이터를 생성하겠습니다. 먼저, mat라는 행렬(matrix) 데이터를 생성한 후, 리스트(list) 타입으로 변환하여 info라는 변수에 저장합니다. # info라는 list에 mat 이라는 matrix 생성 # 원소는 c() 함수에 할당된 ..
해당 포스트는 R에서 난수 추출 방식을 이용하여 로또 게임 함수를 만드는 방법에 대해 소개합니다. INTRO 처음 프로그래밍을 공부하던 시기에는 다양한 이론 공부들보다 실습하는 시간이 좋았고, 그 중에서도 어렵지 않은 게임을 구현하는 실습을 좋아했습니다. 공부한 내용을 기반하여 결과를 출력하는 완성된 코드를 작성했다는 성취감도 있었지만, 아직은 부족하지만 (많이) 보완 된다면 실제 생활에 활용 가능한 결과물 될 수 있다는 것에 성취감을 더 크게 느꼈던 것 같습니다. 로또 게임은 목적에 따라 좀 더 현실감있게 만들 수 있겠지만, 아래에서는 입문자 분들이 구현할 수 있도록 난수를 이용해 로또 번호 6개를 추출하는 함수를 만들어 보겠습니다. 질문 R프로그래밍 질문 2) 로또 함수 만들기 풀이 로또 함수는 목표..
해당 포스트는 1부터 100까지 숫자들 중 3의 배수의 합과 평균을 계산하는 방법을 소개합니다. INTRO R프로그래밍 기초 과정에서는 사칙연산(더하기, 뺄셈, 곱셈, 나눗셈)을 활용하여 프로그래밍 하는 기본 방법에 대해 많이 연습하게 됩니다. 해당 문제는 '3의 배수'를 찾아내는 방법만 이해하면 쉽게 풀 수 있는 문제로 아래에서 설명하도록 하겠습니다. 질문 R프로그래밍 질문 1) 1부터 100까지 3의 배수의 합과 평균내기 풀이 프로그래밍 문제는 다양한 방법으로 풀이 가능합니다. 예를 들어, 해당 문제도 반복문을 이용하여 풀 수도 있고, 간단한 벡터 연산으로 풀이도 가능합니다. 물론 이 외의 방법들도 존재합니다. 아래에서는 반복문이 아닌 벡터 연산으로 풀이하는 방법에 대해 설명할 예정이며..
해당 포스트는 R에서 날짜 데이터를 이용하여 시각화 하는 과정에서 데이터 형식이 맞지 않아 발생하는 에러 해결 방법에 대해 소개합니다. INTRO R에는 다양한 데이터 형식(Data Type)이 존재합니다. 특히, 날짜 데이터의 경우, 임의로 텍스트 형식으로 처리하는 경우가 종종 있지만, 모든 데이터는 본래에 형식에 맞게 데이터 형식(Data Type)을 맞춰준 뒤 처리하는 것이 좋습니다. 아래에서는 날짜 데이터를 다루는 과정에서 데이터 타입을 맞추지 않고 시각화 하려 했을 때 발생하는 에러를 해결하는 과정을 설명합니다. 문제 해결하기 1. 데이터 생성 먼저, 상황 재현을 위해 날짜 데이터(date)와 온도(temp)가 들어있는 데이터 프레임(Data frame) mydata를 생성해 보겠습니다. myd..
해당 포스트는 R에서 벡터에 들어있는 양수의 개수를 카운트하는 방법에 대해 소개합니다. INTRO R에서 벡터(vector)는 가장 많이 다루기에 가장 중요한 자료 구조(Data Structure)입니다. 벡터(vector)를 다루는 다양한 연습을 한다면 앞으로의 R프로그래밍 역량 개발에 큰 도움이 될 것이라 생각하빈다. 아래에서는 실수값만을 원소로 가지는 벡터에서 양수의 개수를 찾아주는 사용자 함수 생성 방법을 설명합니다. 질문 풀이 1. 벡터 생성 먼저 실수값만으로 이루어진 벡터 x를 생성하겠습니다. x 0은 x의 값들 중 0보다 큰 값들을 TRUE로 리턴해 줍니다. x > 0 [1] TRUE FALSE TRUE FALSE TRUE FALSE TRUE 조건식을 만족하는 값의 개수 세기 위 결과에서 조..