해당 포스트는 네이버지식인을 통해 질문 받은 "기초 통계 및 시각화(히스토그램, 파이차트)"에 대한 답변을 공유하는 글입니다. 문제 다음은 경영대 30명에게 전공이 무엇인지 물어본 결과이다. 1) 빈도분포와 막대그림을 보여라. 2) 상대빈도분포와 원형그림을 보여라 풀이 해당 문제는 데이터 생성부터 간단한 통계량 산출과 시각화까지 요구하고 있습니다. 난이도가 높지 않은 문제로 아래에 설명을 차례대로 읽으신다면 쉽게 이해하실 수 있으실 겁니다. 1. 데이터 생성 먼저 데이터셋을 생성하겠습니다. 데이터는 별도 구조가 제시되지 않았기에 단순 벡터로 만들면 됩니다. my_data
해당 포스트는 골든래빗 출판사로부터 책을 제공받아 작성했습니다. INTRO 평소 블로그를 운영하면서 HTML과 CSS에 대한 호기심을 가지고 있었는데 골든래빗에서 좋은 기회를 제공해 주어 책을 읽고 소개할 기회를 얻었습니다. 해당 도서는 비전공자들을 대상으로한 챌린지 형식의 코딩 입문서이며 크게 3단계로 구분되어 내용이 소개됩니다. 이 책의 구성 이 책은 0~3단계까지 코딩 배경지식, HTML, CSS, 코딩 맛보기, 클론코딩을 차례대로 진행합니다. 비전공자의 눈높이에 맞추어 최대한 쉽게 설명하려고 노력하고 있습니다. 1단계 : 첫 코딩에 입문하기 1단계에서는 나만의 코딩 목표를 세우고, 웹이 무엇인지, 코딩이 무엇인지 소개합니다. 웹 코딩의 첫 관문인 HTML로 첫 코딩에 입문하게 됩니다. 2단계 : ..
해당 포스트는 R에서 행렬 생성 방법과 부분 행렬을 추출 방법을 설명합니다. 1. INTRO R에서 행렬(matrix)은 빈번하게 사용되지는 않지만 반드시 알고 있어야 하는 자료 구조입니다. 네이버 지식인에서 행렬 생성 및 부분 행렬 추출 방법에 대해 질문을 받아 간단한 사용 예제를 정리하였으니 참고하시면 좋을 것 같습니다. 2. 질문 R프로그래밍 부분행렬 질문이요! 1부터 50까지의 정수로 5개의 열을 갖는 행렬을 생성하고, 마지막 두 개 행과 마지막 세 개 열로 구성된 부분행렬을 만드시오. 문제가 이건데 답이뭔가요? 작동원리도 설명해주시면 감사하겠습니다! 3. 풀이 1. 행렬 생성 R에서 행렬을 생성해주는 함수는 matrix()입니다. 문제에서 제시된 1부터 50까지의 수를 5열의 행열로 만드는 코드..
해당 포스트는 과학기술정보통신부에서 주최하는 2021 인공지능 데이터 활용 경진대회에 대해 소개하는 글입니다. INTRO 과학기술정보통신부에서 주최하는 이번 경진대회는 3개 분야(lifestyle, industry, public)에 AI 서비스를 발굴하는 것을 평가하는 대회이며, 대상에게는 과기정통부 장관상 및 1,500만 원의 상금이 수여되는 큰 경진대회입니다. 이번 대회는 대한민국 국민이면 누구나 참가할 수 있으며, 대회 기간은 12월 1일까지로 여유가 있는 편입니다. 입상팀에게는 상금 외에도 다양한 특전도 수여될 예정이니 관심 있으신 분들은 지원해보시면 좋을 것 같습니다. 자세한 내용은 아래 정리하였으니 확인해 보세요! 참여 절차 및 일정 인공지능 서비스 기획/개발에 관심 있는 대한민국 누구나 참여..
해당 포스트에서는 R에서 5의 배수 벡터 생성 방법과 5의 배수 벡터 추출 방법을 소개합니다. 1. INTRO R에서 벡터(Vector)는 가장 기본 자료 구조이면서 가장 중요한 역할을 합니다. R프로그래밍을 배우면서 벡터 연산을 많이 접하시게 될텐데 나중에는 벡터를 얼마나 잘 다루느냐에 따라 프로그래밍 능력의 판단 기준이 될 수 있으니 꾸준히 연습하시는 것을 추천드립니다. 아래에서는 벡터 프로그래밍 사례인 5의 배수 벡터 생성 방법과 5의 배수 벡터 추출 방법에 대해 설명하겠습니다. 2. 5의 배수 벡터 생성 R에서 5의 배수 벡터를 생성하는 방법은 다양합니다. 짧은 경우에는 직접 프로그래밍하여 생성할 수 있으며, 만약 5의 배수를 1000까지 생성해야 한다면 내장 함수를 이용해 간단히 해결할 수 있습..
이 포스트는 한빛미디어에서 출간한 'fastai와 파이토치가 만나 꽃피운 딥러닝' 을 읽고 작성한 서평입니다. INTRO 이 책에서 소개하는 fastai 라이브러리는 현대적으로 가장 뛰어난 뉴럴넷을 빠르고 정확하게 학습시키는 방법을 간소화해주는 장점이 있습니다. fastai 웹사이트에서 간단한 사용법을 확인할 수 있으며, Vision, Text, Tabular, Collab(collaborative filtering) 관련 모델들에 적용해 볼 수 있습니다. 최근 딥러닝 연구의 활성화로 다양한 모델들이 빠르게 생성되고 있는 상황에서 fastai 라이브러리는 딥러닝 연구자들이 시간을 효율적으로 활용할 수 있도록 지원해 줍니다. 이 책을 통해 자신의 딥러닝 개발 코드를 간소화 하신다면 보다 효율..
해당 포스트에서는 R에서 줄기-잎 그림(Stem-and-Leaf Plot)을 출력하는 방법을 소개합니다.1. INTRO줄기-잎 그림(Stem-and-Leaf plot)은 통계학에서 통계적 자료를 표(table) 형태와 그래프(Graph) 형태의 혼합된 방법으로 나타내는 시각화를 말하며, R에서 내장 함수인 stem()을 이용해 줄기-잎 그림을 그릴 수 있습니다. 아래에서는 내장 데이터셋인 tree 데이터를 이용해 줄기-잎 그림을 시각화하는 방법을 설명 드리겠습니다.2. 줄기-잎 그림 그리기이번에 사용할 tree 데이터는 31그루의 벌목된 검은 벚나무의 지름, 높이, 부피 측정값을 제공이 들어있습니다.Girth(numeric) : Tree diameter (rather than girth, actuall..
해당 포스트는 R에서 한글 경로 인식 오류로 인해 발생한 에러를 조치하는 방법에 대해 소개합니다. 문제Rstudio에서 run버튼을 눌렀을 때는 결과가 잘 나왔는데 source 버튼만 누르면 이런 오류가 떠서요 혹시 와 이런 오류가 뜨는 지 알 수 있을까요? 풀이해당 에러는 Source 메뉴로 코드 실행 시, 작업 디렉토리 경로에 한글이 있어 발생한 에러입니다.R은 한글 친화적인 언어가 아니기에 프로그래밍 시 한글 사용을 권장하지 않으며, 특히 경로에 한글이 있는 경우에는 패키지 설치나 실행에 오류가 발생할 여지가 있습니다.만약 R 및 RStudio를 설치한 지 얼마 되지 않으셨다면 아래 링크들을 참고하여 재설치하시는 걸 추천드립니다.[R] Windows10 에서 R 설치 하기 (1/2)[R] Wind..
해당 포스트에서는 RStudio 작업환경 자동 저장 옵션을 끄는 방법을 소개합니다. INTRO작업환경 자동 저장 옵션은 RStudio를 설치하면 기본적으로 활성화되는 옵션으로 작업하던 도중 메모리 오버나 실수로 RStudio도 종료되었을 때 기존 작업 환경이 유지될 수 있도록 도와주는 목적의 옵션입니다.그러나 공동 PC에서 작업하시는 분들에게는 해당 옵션으로 인해 자신의 코드가 노출될 수 있다는 우려가 있어 가끔 자동 저장 옵션을 끄고 싶어 하시는 분들이 계십니다.해당 방법에 대해 간단하게 아래에 정리하였으니 참고하여 적용하시면 됩니다.자동 저장 옵션 끄기자동 저장 옵션은 RStudio 옵션에서 확인 및 조정 가능합니다.위치 : [Tools] - [Global Options] - [General] - [..
이번 포스트는 데이터 분석 전문가(ADP) 실기시험을 준비하는 분들에게 도움이 되고자 확인된 내용을 공유하는 글입니다. 어제 Kdata 홈페이지에 데이터분석전문가(ADP) 22회 실기시험 관련 공지가 등록되었습니다. 실기시험 응시 가이드, R 패키지 목록, Python 패키지 목록들이 안내되었으며, 서울 외에 대전과 부산 고사장이 추가되었습니다. 아래 기출 자료 리스트 및 실기 후기들을 참고하시어 좋은 결과 있으시길 바라며, 자세한 공지는 하단 링크에서 확인 가능합니다. 링크 : Kdata - 제22회 데이터분석 전문가(ADP) 실기시험 응시안내 ADP 실기 기출 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 1. 통계 분석 데이터분석전문가(ADP) 실기시험 기출문제 조사 - 2. 데이터 마이닝 &..