'DataScience/R 프로그래밍' 카테고리의 글 목록

[R] 기초 통계량 계산하는 사용자 함수 만들기

해당 포스트는 네이버지식인을 통해 질문 받은 '두 인자 x,y의 최대값, 최소값, 합계, 분산 및 표준편차를 계산하고 결과를 리스트로 출력하는 방법'에 대한 답변을 공유하는 글입니다. 만약, 최대값/최소값만 찾는 코드가 필요하신 분은 아래 링크를 참고해 주세요. [R] 최대/최소값 찾는 함수 만들기 질문 두 인자 x, y의 최대값, 최솟값, 합계, 분산, 표준편차를 계산하여 리스트 형태로 결과를 출력하는 함수를 만들어 주세요. 풀이 1. 문제 해석 데이터 분석과 통계에서 최댓값(max()), 최솟값(min()), 합계(sum()), 분산(var()), 표준편차(sd())와 같은 요약 통계량을 계산하는 것은 자주 수행하는 작업입니다. 문제에서는 R 내장 함수인 summary()를 사용하지 않..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 4. 17.
textsms

[R] as.factor 함수로 데이터셋 분할하기

해당 포스트에서는 R에서 특정 열을 범주형 변수(as.factor)로 변환하고 이를 활용하여 데이터셋을 분할하는 방법을 소개합니다. INTRO R에서는 다양한 데이터셋 분할 방법이 있습니다. 이 포스트에서는 특정 컬럼을 범주형 변수로 변환하여 범주에 맞게 데이터셋을 분할하는 방법에 대해 샘플 데이터와 함께 설명합니다. 데이터셋 분할하기 1. 샘플 데이터 생성 먼저, data.frame() 함수를 사용하여 mydf 데이터 프레임을 만듭니다. 이 데이터 프레임은 Lake, Year, Count 세 가지 열(column)을 가지며, 각각의 열에는 A, B, C라는 세 개의 Lake, 2011년과 2012년, 그리고 각 호수와 연도에 따른 물고기 수(Count)가 포함되어 있습니다. mydf

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 26.
textsms

[R] 반복문 비교 및 코드 예시 설명(3,5,7,9,11 트리 구조 출력)

해당 포스트에서는 네이버 지식인을 통해 질문 받은 반복문을 이용한 특정 출력 방법(3,5,7,9,11 트리 구조 출력)에 대해 설명합니다. INTRO R의 대표적인 반복문에는 for(), while(), repeat() 문이 있습니다. 각 반복문은 유사하게 동작하지만 조금씩 다른 사용법을 가지고 있으며, 아래에서는 네이버 지식인에서 질문받은 문제를 이용하여 예시와 함께 설명합니다. 반복문 비교 아래 세 가지 반복문은 각각의 특성에 따라 적합한 상황이 있으며, 적절히 활용하는 것이 중요합니다. for문은 리스트나 벡터와 같은 순차적인 데이터를 처리하는 경우에 유용하며, while문은 반복 조건에 따라 반복 횟수가 결정되는 경우에 적합합니다. 반면, repeat문은 무한 반복문으로, 반복을 중단할 조건이 명..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 20.
textsms

[R] 데이터 프레임(Data Frame) 그룹합 계산하기 (feat. aggregate)

해당 포스트는 데이터 프레임(Data Frame)의 특정 컬럼을 기준으로 그룹 합계(Group Sum)을 계산하는 방법을 소개합니다. INTRO R에서 그룹합(Group Sum)을 계산하는 경우는 집단별 합계, 성별 인원 합계, 연령대 소득 합계 등 다양합니다. 아래에서는 R에서 제공되는 다양한 그룹합(Group Sum) 함수들 중, 추가 설치 없이 사용 가능한 aggreate() 함수에 대해 설명하고 예시 데이터와 함께 간단한 풀이를 진행합니다. aggregate? aggregate()는 데이터를 하위 집합으로 분할하여, 각각에 대한 요약 통계를 계산하고 편리한 형식으로 결과를 반환해주는 함수입니다. 함수 사용법 aggregate(x, FUN, …, simplify = TRUE, drop = TRUE)..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 20.
textsms

[R] 숫자 데이터 범위에 따라 그룹 지정하기 (feat. ifelse)

해당 포스트에서는 R에서 숫자 데이터 범위에 따라 그룹을 지정하는 방법에 대해 소개합니다. INTRO ifelse() 함수는 R 프로그래밍 언어에서 자주 사용되는 함수 중 하나로, 간단한 조건문을 작성할 때 사용되며, if-else 문의 간단한 버전이라고 생각하시면 됩니다. 자주 사용되는 함수이기도 하지만, 쉽게 사용할 수 있어 간단한 예시 몇 개만 익히신다면 금방 마스터하실 수 있습니다. 아래에서는 간단한 예시와 함께 코드 사용 방법에 대해 설명합니다. 문제 풀어보기 먼저, 0부터 12까지의 정수를 갖는 숫자 벡터인 mydata를 생성하고, 이를 출력해 보겠습니다. # 숫자 벡터 생성 mydata = 10, "a", NA)))) [1] "d" "d" "d" "c" "c" "c" "b" "b" "b" "..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 19.
textsms

[R] 특정 변수값에 맞춰 데이터 분할하기 (feat. MASS, Cars93)

해당 포스트는 MASS패키지의 Cars93 데이터셋을 Origin 변수값에 따라 두 그룹으로 분할하는 방법을 소개합니다. INTRO 데이터 분석을 하다보면 'train/test', '합격/불합격', '남자/여자' 등 데이터셋을 분할하는 경우가 많이 발생합니다. 데이터셋을 분할하기 위해서는 기준이 필요한데, 특정 컬럼 또는 데이터에 기준이 있는 경우라면 쉽게 해결이 가능합니다. 아래에서는 MASS 패키지에서 제공되는 Cars93 데이터셋을 이용하여 Origin 컬럼값에 따라 데이터를 분할하는 방법을 설명합니다. 문제 풀이 MASS 패키지에서 제공되는 Cars93 데이터셋을 이용하여 Origin 컬럼값에 따라 데이터를 분할하는 R코드는 다음과 같습니다. 아래 코드는..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 8.
textsms

[R] Problem 1 : 1000보다 작은 자연수 중에서 3 또는 5의 배수를 모두 더하면?

해당 포스트는 프로그래밍 공부를 위해 Project Euler에서 제공되는 알고리즘 문제를 다양한 접근으로 풀이한 글입니다.Problem문제번호 : 1제목 : 1000보다 작은 자연수 중에서 3 또는 5의 배수를 모두 더하면?설명 : 10보다 작은 자연수 중에서 3 또는 5의 배수는 3, 5, 6, 9 이고, 이것을 모두 더하면 23입니다. 1000보다 작은 자연수 중에서 3 또는 5의 배수를 모두 더하면 얼마일까요?Solution-1R Code# 1부터 1000까지의 수열을 생성합니다.x 코드 설명해당 문제는 1부터 1000까지의 자연수 중에서 3 또는 5의 배수의 모든 합을 구하는 것이 목적입니다. 다양한 풀이 방법이 있을 수 있으나 가장 짧은 코드 풀이를 아래에서 설명하도록 하겠습니다.먼저 1부터 ..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 4.
textsms

[R] 피보나치 수열 (Fibonacci numbers)

해당 포스트에서는 피보나치 수열(Fibonacci numbers)에 대해 소개하고, 실습으로 300보다 작은 모든 피보나치 숫자들을 찾는 방법을 소개합니다.참고로, Python 코드는 아래 사이트에서 확인하실 수 있습니다.[Python] 피보나치 수열 (Fibonacci numbers)피보나치 수열(Fibonacci numbers)?피보나치 수열은 각 항이 바로 앞 두 항의 합과 같은 수열입니다. 즉, 0과 1로 시작하고, 그 다음 항부터는 바로 앞의 두 항을 더한 값으로 이루어진 수열입니다.예를 들어, 피보나치 수열의 처음 몇 항은 다음과 같습니다. 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 67..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 3. 3.
textsms

[R] 데이터 프레임 내 모든 숫자를 '홀수'와 '짝수'로 바꾸기

해당 포스트에서는 R에서 데이터 프레임(Data Frame)에 있는 모든 숫자 데이터를 한 번에 '홀수'와 '짝수'로 변환하는 방법에 대해 설명합니다. INTRO R에서 사용되는 기본 자료형(Basic Data Types)은 총 5가지가 있습니다. 그 중에서도 수치형(numeric or integer)과 문자형(character)은 상대적으로 많이 사용되기도 하지만, 데이터 분석 과정에서 변환을 통해 데이터 특성을 다르게 고려해야 하는 경우가 종종 발생합니다. 아래에서는 네이버 지식을 통해 받은 질문 중, 데이터 프레임(Data Frame)에 저장된 모든 숫자를 한 번에 '홀수', '짝수'라는 문자로 변경하는 방법에 대해 설명합니다. 질문 내용 및..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 1. 9.
textsms

[R] 점수를 입력받아 학점 계산하기 ('A+'에서 'F'까지)

해당 포스트는 R에서 사용자에게 점수를 입력받으면 학점(등급)을 계산하여 출력해주는 방법에 대해 소개합니다. INTRO 사용자에게 점수를 입력받고, 구간에 따라 학점(등급)을 출력해 주는 함수를 생성해 보겠습니다. 간단하지만 기초 단계에 배우는 사용자 입력, 조건문, 반복문까지 필요한 문제이기에 아래 설명을 참고하시어 기초를 이해하시고 활용해 보시면 좋을 것 같습니다. 질문 풀이 1. 문제 파악 먼저, 문제에서 제시된 조건들을 정리하면 아래와 같습니다. 0부터 100사이의 정수 값 입력받기 입력받은 정수를 학점으로 변환 for반복문을 이용하여 5회 반복 readline() 을 사용하여 사용자 입력 받기 입력받은 문자열을 숫자로 변경할 때 as.numeric() 함수 사용 4,5번 조건은 1번 코드를 작성..

format_list_bulleted DataScience/R 프로그래밍
· 2023. 1. 8.
textsms