해당 포스트는 R 연산자 종류 및 사용법 - 초급편을 소개합니다.
Lists
[R] 연산자(Operator) 종류 및 사용법 - 기초편
[R] 연산자(Operator) 종류 및 사용법 - 초급편
[R] 연산자(Operator) 종류 및 사용법 - 중급편
[R] 연산자(Operator) 종류 및 사용법 - 고급편
INTRO
R을 사용하면서 프로그래밍 스킬도 중요하지만 함수 및 연산자에 대한 이해만 가지더라도 효율적인 R활용이 가능합니다. 이번 포스트에서는 R에서 기본적으로 제공하는 연산자들을 소개하고 예시와 함께 사용법을 설명합니다.
1. 벡터 포함 여부 : %in%
R에서 벡터 간의 포함 여부를 파악하기 위한 연산자로는 %in%
입니다. 즉, 우측의 값들이 왼쪽에 들어있는지 확인하는데 사용되는 연산자이며, 값이 들어있는 경우 매칭된 위치에 TRUE
값이 리턴됩니다.
# 1부터 10사이에 2 또는 4 또는 6이 들어있는지 확인
1:10 %in% c(2, 4, 6)
[1] FALSE TRUE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE
2. 패키지의 함수를 불러오기 : ::
R에서 특정 패키지에 들어있는 함수를 사용하려는 경우, ::
연산자를 사용합니다. 기본적으로 함수명만 사용하지만, 특정 패키지의 함수를 사용하려는 경우에는 패키지명::함수명()
의 형태로 사용해야 합니다.
# 내장 함수 filter()가 아닌 dplyr 패키지의 filter() 함수를 사용하려는 경우
library(dplyr)
dplyr::filter()
# 내장 함수 filter()
?filter()
# dplyr 패키지의 filter()
?dplyr::filter()
3. 체인 연산자(Chain Operator) : %>%
dplyr 패키지를 로딩하면 파이프 연산자를 사용할 수 있습니다. 파이프 연산자(%>%)는 체인 연산자(chain operator) 또는 줄여서 파이프라고도 하는데, 물길을 연결하는 파이프처럼 데이터와 데이터를 연결하는 dplyr 패키지의 핵심 연산자입니다. '데이터를 전달한다'고 생각해도 됩니다. 즉, 앞서 연산된 결괏값이나 데이터를 다음으로 전달하는 역할을 하는 것이 파이프 연산자입니다. (출처 : 모두의 R 데이터 분석)
아래 예시에서 plot()
함수는 기본적으로 x와 y의 값을 모두 입력해 주어야 하지만, 아래에서는 x값은 %>%
연산자로 전달하고 우측에서는 plot(y)
로 사용한 것을 볼 수 있습니다. 순차적인 데이터 처리가 가능하게 해주는 연산자로 R 활용을 위한 필수 스킬이라고 볼 수 있습니다.
library(dplyr)
x <- 1:10
y <- x*2
x %>% plot(y)
관련 링크
[1] 슬기로운통계생활 Youtube - R 연산자 (operator) 어디까지 알고있니? 기초편
[2] [R] 연산자(Operator) 종류 및 사용법 - 기초편
[3] [R] 연산자(Operator) 종류 및 사용법 - 초급편
[4] [R] 연산자(Operator) 종류 및 사용법 - 중급편
[5] [R] 연산자(Operator) 종류 및 사용법 - 고급편