해당 포스트는 제이펍에서 출간한 '그림으로 배우는 StatQuest 머신러닝 강의'를 읽고 작성한 서평입니다. INTRO StatQuest 유튜브 채널을 운영하고 있는 Josh Starmer는 머신러닝에 필요한 개념들을 그림과 함께 알기 쉽게 설명하는 것으로 유명합니다. 컴퓨터 공학 입문자 분들에게 자칫 어려울 수 있는 통계 및 머신러닝 용어들을 그림과 함께 만화책을 보듯 이해할 수 있으며, 간략하지만 때로는 깊이 있는 내용을 다루기에 현직 데이터 과학자 분들에게도 도움이되는 책이라고 생각됩니다. 아래에서 책에 대한 간략한 소개와 제의 서평을 정리하였으니 책 선택에 도움이 되셨으면 좋겠습니다. 책 소개 지금까지 이보다 더 시각적이고 직관적인 머신러닝 강의는 없었다 머신러닝은 놀랍고 강력한 ..
이번 포스트는 2023년 데이터 분석 전문가(ADP) 및 준전문가(ADsP) 시험 일정을 공유합니다. 실기 기출 문제 정리 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 1. 통계 분석 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 2. 데이터 마이닝 & 기계 학습 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 3. 텍스트 마이닝 2023년 ADP/ADsP 시험 일정 2023년 데이터 분석 전문가/준전문가 시험 일정 및 기출 자료를 공유 드립니다. 데이터 분석 자격증(ADP)는 2021년 2,436명이 응시하여 최종 66명이 합격한 난이도 있는 시험입니다. (합격률 2.71%) 어려운 시험인만큼 외부의 시선도 높아지면 좋겠지만, 현실적으로 면접관 입장에서는 해당 자격증으로 판단하기 어려운..
해당 포스트에서는 RStudio 시작 시, 작업 환경이 자동 복구되는 기능을 옵션에서 조정하는 방법을 설명합니다. INTRO RStudio에서는 작업 환경의 연속성을 위해, 기본적으로 작업 종료 시 환경을 저장하고, 다음 작업에서는 이전 환경을 자동으로 불러올 수 있게 기능이 제공되고 있습니다. 하지만 작업 연속성이 필요없거나 이전 작업의 불필요한 메모리 사용이 있었다면 이러 기능은 일반 사용자 분들에게는 오히려 불편하게 다가올 수 있습니다. 아래에서는 RStudio 작업 환경 자동 복구 기능을 끄거나 키는 방법에 대해 설명합니다. 질문 Rstudio를 사용하고 껐다가 다음날 키면 전에 썼던 내용이 그대로 뜨는 이유는 뭔가요?? 어떻게 하면 다음날 켜도 전에 했던 것들이 안뜨나요?? 답변 RStudio는..
해당 포스트에서는 posit(formerly RStudio) Engineer가 발표한 'R 파일명을 정의하는 방법'에 대해 소개합니다. INTRO 파일명을 정의하는 방법에는 다양한 방법이 있고, 개인마다 스타일이 있습니다. 하지만, 분석가나 개발자의 경우, 기계가 좀 더 잘 이해할 수 있고, 분석에 좀 더 잘 활용할 수 있으며, 타인이 봐도 직관적으로 이해할 수 있는 스타일로 파일명을 정의하는 것이 생산성 및 효율성을 높이는 방법 중 하나라고 생각합니다. 아래에서는 posit(formerly RStudio) engineer인 Jennifer Bryan이 제안하는 파일명 정의 방법에 대해 정리 및 설명합니다. 좋은 파일 이름은... 좋은 파일 이름은 아래 3가지 기준을 충족해야 합니다. 기계..
해당 포스트에서는 Python(파이썬)에서 발생 가능한 오류의 큰 범주인 구문 오류(Syntax Error)와 의미 오류(Semantic Error)에 대해 설명합니다. 1. 구문 오류 (Syntax Error) 유효하지 않은 파이썬 코드를 입력했을 발생하는 오류로, 코드 실행 자체가 되지 않기에 바로 확인 가능한 직관적인 에러입니다. 사용하는 IDE(Visual Studio, Pycharm 등)에서 문법 교정 옵션이 활성화되어 있다면 쉽게 해결할 수 있습니다. e.g. 미완성된 코드 실행, 할당문의 문법적 오류 등 2. 의미 오류 (Semantic Error) 파이썬이 할 수 없는 명령을 내렸을 때 발생하는 오류로, 수(number)를 0으로 나눈다든지, 존재하지 않는 변수를 사용하는 등의 케이스가 있..
해당 포스트에서는 R에서 데이터 프레임(Data Frame)에 있는 모든 숫자 데이터를 한 번에 '홀수'와 '짝수'로 변환하는 방법에 대해 설명합니다. INTRO R에서 사용되는 기본 자료형(Basic Data Types)은 총 5가지가 있습니다. 그 중에서도 수치형(numeric or integer)과 문자형(character)은 상대적으로 많이 사용되기도 하지만, 데이터 분석 과정에서 변환을 통해 데이터 특성을 다르게 고려해야 하는 경우가 종종 발생합니다. 아래에서는 네이버 지식을 통해 받은 질문 중, 데이터 프레임(Data Frame)에 저장된 모든 숫자를 한 번에 '홀수', '짝수'라는 문자로 변경하는 방법에 대해 설명합니다. 질문 내용 및..
해당 포스트는 R에서 사용자에게 점수를 입력받으면 학점(등급)을 계산하여 출력해주는 방법에 대해 소개합니다. INTRO 사용자에게 점수를 입력받고, 구간에 따라 학점(등급)을 출력해 주는 함수를 생성해 보겠습니다. 간단하지만 기초 단계에 배우는 사용자 입력, 조건문, 반복문까지 필요한 문제이기에 아래 설명을 참고하시어 기초를 이해하시고 활용해 보시면 좋을 것 같습니다. 질문 풀이 1. 문제 파악 먼저, 문제에서 제시된 조건들을 정리하면 아래와 같습니다. 0부터 100사이의 정수 값 입력받기 입력받은 정수를 학점으로 변환 for반복문을 이용하여 5회 반복 readline() 을 사용하여 사용자 입력 받기 입력받은 문자열을 숫자로 변경할 때 as.numeric() 함수 사용 4,5번 조건은 1번 코드를 작성..
해당 포스트는 R에서 행렬(matrix)을 리스트(list)에 저장한 후 특정 연산을 수행하는 방법에 대해 소개합니다. INTRO 행렬(matrix)은 R에서 많이 사용되는 데이터 프레임(Data frame)과 유사하여 데이터 조작이 낯설지 않으실 겁니다. 하지만, 리스트(list)에 저장된 행렬(matrix)을 조작하려는 경우에는 다른 코드 사용법을 알아야 하며 아래에서는 그 방법에 대해 설명합니다. 질문 풀이 1. 데이터 생성 문제에서 주어진 연산이 가능하도록 데이터를 생성하겠습니다. 먼저, mat라는 행렬(matrix) 데이터를 생성한 후, 리스트(list) 타입으로 변환하여 info라는 변수에 저장합니다. # info라는 list에 mat 이라는 matrix 생성 # 원소는 c() 함수에 할당된 ..
해당 포스트는 한경비즈니스에서 포스팅한 자료를 보고 개인적으로 정리한 내용입니다. 뭐 새로운거 없을까? 모든 사람이 가지고 있는 '숙제' 같은 질문이다. 최고경영자(CEO)나 리더라면 '조직의 새로운 성장 동력'을 찾기 위해 새로운 아이템을 끊임없이 고민핟. 편집을 통해 만든 창조물 '아이폰' 스티브 잡스가 한 것은 각각의 기기에서 따로따로 쓰이고 있던 기술을 아이폰이라는 하나의 물건에 잘 담아낸 것이다. 기존에 있던 것을 엮에 새롭게 재구성하는 '편집'이 창조를 이끌어 낼 수 있다. "스티브 잡스의 천재성은 기존 제품을 개량해 새로운 것을 만들어 내는 편집 능력"이다. - 언론인 출신 베스트셀러 작가 '말콤 글래드웰' 첫째 연결 &..
해당 포스트는 포츈코리아(FORTUNE KOREA)의 '다시 지원하고 싶은 회사 vs 붙어도 안 갈 회사'에 대한 기사를 읽고 개인적인 의견을 정리한 글입니다. 기업이 가장 신경써야 할 채용 절차 중 하나가 '면접'이다. 지원자 역시 면접을 통해 출근 여부를 가늠하기 때문이다. 박보희 컴퍼니타이임즈 기자 면접 과정은 면접관, 지원자 모두에게 어려운 자리입니다. 지원자는 짧은 시간동안 자신의 강점, 장점을 어필해야하고, 면접관은 다양한 질문을 통해 면접자의 숨은 특성까지 파악하고 평가해야 합니다. 과거 면접관들의 일방적인 평가로 진행되던 과거와는 달리, 최근에는 면접관과 면접자가 서로를 평가하는 형태로 변화하고 있으며, 이 때, 주고 받는 대화 외에도 제스처, 태도, 눈빛 등 ..