해당 포스트는 R을 사용하면서 발생할 수 있는 기호(symbol) 사용 관련 에러에 대해 소개합니다. 에러pie(c(10, 20, 30, 40)), labels = c("a", "b", "c", "d"))Error: unexpected ',' in "pie(c(10, 20, 30, 40)),"한글인 경우 아래와 같이 에러 메세지가 출력됩니다.에러: 예기치 않은 ','입니다 in "pie(c(10,20,30,40), labels = c("a", "b", "c', "d" ~ 원인R을 사용하다보면 다양한 에러를 보게 됩니다. 위에서 발생한 에러는 문법 오류로 발생한 에러로 중간 괄호가 삽입되어 pie() 함수의 labels 옵션이 정상적으로 반영되지 못해 발생한 에러입니다.위에서 사용한 코드를 자세히 보면 p..
해당 포스트는 R을 사용하면서 발생할 수 있는 기호(symbol) 사용 관련 에러에 대해 소개합니다. 에러pie(c(10, 20, 30, 40)), labels = c("a", "b", "c', "d"))Error: unexpected symbol in "pie(c(10, 20, 30, 40), labels = c("a", "b", "c', "d"한글인 경우 아래와 같이 에러 메세지가 출력됩니다.에러: 예상하지 못한 기호(symbol)입니다. in "pie(c(10,20,30,40), labels = c("a", "b", "c', "d" ~ 원인R을 사용하다보면 다양한 에러를 보게 됩니다. 위에서 발생한 에러는 문법 사용에 오류로 발생한 에러로 특수 기호(symbol)인 따옴표와 쌍따옴표를 혼용하여 발생..
해당 포스트에서는 R에서 벡터(vecotr) 연산을 통해 문제와 정답이 있을 때 점수를 계산하는 방법을 설명합니다. 1. INTRO 네이버 지식iN에서 지식을 공유하고 있습니다. 간단한 질문들은 해당 질문에 바로 답변을 드리지만 질문의 내용이 유익하거나 추가 설명이 필요한 경우에는 포스팅을 작성하여 공유드리고 있습니다. 2. 질문 3. 풀이 이번 문제에서는 R에서 벡터 연산 방법에 대해 다룹니다. 문제에서는 3개의 벡터(point,answer,mark)가 주어지며, 내가 작성한 답(mark)과 정답(answer)을 비교하여 배점(point)을 기준으로 점수를 계산합니다. 결과를 도출해야 하는 문제는 총 3문제이며, 해당 풀이에서는 벡터 비교를 통해 참값(TRUE)에 해당하는 값들을 추출하고 합(sum)을..
해당 포스트에서는 R에서 성별로 키에 대한 평균, 분산, 표준편차 계산 방법을 설명합니다. 1. INTRO R에서는 데이터의 그룹 계산을 위해 aggregate() 내장 함수를 제공하고 있습니다. 이번 포스트에서는 성별(남/여), 키(cm) 정보가 들어있는 데이터에서 성별 그룹 계산 방법을 설명합니다. 2. 데이터셋 생성 이번 설명에서 사용할 데이터셋은 아래와 같습니다. x
해당 포스트는 R에서 행렬(matrix)을 생성할 때 사용되는 byrow 옵션에 대해 설명 합니다. 1. INTRO R에서 2차원 형태의 데이터를 생성할 때에는 주로 행렬(Matrix)이나 데이터 프레임(Data Frame)을 사용하게 됩니다. 그 중에서도 숫자로만 이루어진 경우, 행렬(Matrix)을 주로 사용하게 되는데 이 때 자주 사용하는 byrow 옵션에 대해 설명합니다. 2. R에서 행렬(matrix) 생성 일반적으로 R에서 행렬(Matrix)을 생성하려 할 때에는 시퀀스 숫자를 바로 사용하거나 임의의 벡터를 생성 후 사용합니다. 아래는 동일한 행렬을 생성하는 다른 방식의 예시입니다. 1) 연속된 숫자로 행렬 생성 matrix(1:9, nrow = 3) [,1] [,2] [,3] [1,] 1 4..
해당 포스트에서는 R에서 랜덤 데이터 샘플링(추출)방법에 대해 설명합니다. 1. INTRO R에서 랜덤 데이터 추출이 필요한 경우, 내장 함수인 sample()과 dplyr 패키지의 sample_n(), sample_frac() 함수를 사용할 수 있습니다. 아래에서 각 함수의 설명과 사용법을 설명하니 상황에 따라 필요한 함수를 사용하시면 됩니다. 참고 아래 예시에서 설명하는 함수들은 무작위 추출되기에 출력 결과가 다를 수 있는 점 참고 부탁드립니다. 2. sample() sample()은 R에서 제공되는 내장 함수로 별도의 설치가 필요하지 않습니다. sample() 함수는 난수를 추출해주는 함수로 입력 인자값 차이에 따라 각각 다른 결과값을 리턴합니다. 아래 3가지 예시를 준비하였으니 보시고 사용법을 참..
해당 포스트에서는 R에서 데이터 정렬 방법(order(), arrange())에 대해 설명합니다. 1. INTRO R에서 데이터 정렬이 필요한 경우, 내장 함수인 order()와 dplyr 패키지의 arrange() 함수를 많이 사용합니다. 아래에서는 두 함수의 사용 방법을 설명하니 상황에 따라 필요한 함수를 골라 사용하시면 됩니다. 2. order() order()은 R에서 제공되는 내장 함수로 별도의 설치가 필요하지 않습니다. order() 함수만 단독으로 쓰는 경우, 각 값의 순위(rank)가 리턴되기에 일반적으로는 아래와 같이 변수 내 인덱싱에 적용하여 정렬하는데 사용됩니다. mylist 생성 mylist % arrange(mpg) mpg cyl disp hp drat wt qsec vs am g..
해당 포스트에서는 R에서 문자열(String) 조작을 위한 함수 및 방법을 소개합니다. INTRO R에서 문자열(String) 조작 방법을 예시와 함께 설명합니다. 기본은 영어를 기준으로 소개하며, 일부 한글 적용 가능 함수는 예시와 함께 추가 설명하고 있으니 참고하여 이해하시면 됩니다. 데이터 생성 이번 설명에 사용할 문자열 데이터는 아래 코드로 생성 가능합니다. mytext
해당 포스트는 bookdown을 github page와 연동하면서 발생한 에러 조치 방법에 대해 소개합니다. 문제unfinishedgod님 포스트를 참고하여 bookdown 패키지와 github page 연동 시도'3-1. _bookdown.yml 파일 수정' 부분을 진행하면서 아래와 같은 에러 발생File packages.bib not found in resource path 풀이_bookdown.yml 파일을 처음 오픈하면 아래와 같이 기재되어 있고, 아래 사진과 같이 추가 입력해 주어야 함delete_merged_file: truelanguage: ui: chapter_name: "Chapter " 왼쪽과 같이 입력하면 File packages.bib not found in resource..
해당 포스트는 R에서 반복문(for문)을 이용하여 데이터 분할 후 여러 변수에 나누어 저장하는 방법을 설명합니다. INTRO 데이터 분석 작업을 하다보면 통합된 데이터를 분할하여 연도별 또는 범주별로 나누어 저장해야 하는 일이 간혹 발생합니다. 반복문을 이용한다면 데이터셋 분할은 가능하지만, 각기 다른 객체명을 지정해가며 저장하는 방법은 쉽게 떠오르지 않습니다. R에서는 이런 상황을 위해 assign() 함수를 제공하고 있으며, 아래에서 예시와 함께 사용법을 설명 하겠습니다. 이번 설명에서는 iris 데이터셋을 이용하며, Species별(setosa, versicolor, virginica)로 데이터를 분할하고 'iris_'를 접두사 저장하는 방법을 설명합니다. 1. 데이터셋 로드 먼저 d..