해당 포스트는 네이버지식인을 통해 질문 받은 'RStudio 그래프 팝업창 안 뜨게 하는 방법'에 대한 답변을 공유하는 글입니다. 질문 RStudio 그래프를 출력하면 사진처럼 옆에 R 프로그램에서 나온느게 아니라 따로 팝업창으로 나옵니다... 불편해서 바꾸고 싶은데 어떻게 바꾸나요? 풀이 RStudio에서는 그래픽 설정을 통해 출력 결과를 다양하게 표현할 수 있습니다. 질문 상황은 이전 코드 어디에선가 그래픽 출력창을 생성하는 x11()이 실행되었고, 이로 인해 그래픽 출력 결과가 내부가 아닌 팝업으로 생성된 출력창에 출력되는 상황인 것으로 보여집니다. 이러한 상황은 dev.off() 명령어 실행으로 간단히 해결 가능하며, 아래에서는 두 명령어에 대한 설명과 간단한 테스트 코드를 설명합니..
해당 포스트는 R에서 나일강(Nile) 데이터를 이용한 히스토그램 출력 방법을 소개합니다. 1. Intro R 내장 데이터인 Nile은 아스완(Aswan) 지역에서 측정한 나일강의 연간 유량 데이터입니다. 해당 데이터를 이용하여 R에서 히스토그램을 출력해보고, 여러 옵션을 설정해가며 hist()함수의 사용법을 설명합니다. 2. 데이터 불러오기 R에서는 data() 함수로 내장 데이터셋을 불러올 수 있습니다. 데이터셋의 이름을 알고 있는 경우, data(데이터명)과 같이 사용하면 됩니다. data(Nile) Nile Time Series: Start = 1871 End = 1970 Frequency = 1 [1] 1120 1160 963 1210 1160 1160 813 1230 1370 1140 995 ..
해당 포스트에서는 R에서 ggplot2 막대그래프를 출력한 후 텍스트(text labels)을 추가하는 방법에 대해 설명합니다. 1. INTRO R에서 가장 많이 사용하는 시각화 패키지는 ggplot2로 tidyverse 생태계에 포함되어 있으면서 타 패키지들(dplyr, tidyr 등)과의 연동성 및 시각화 종류, 품질 등에 장점을 가집니다. 해당 포스트에서는 ggplot2패키지를 이용하여 출력된 막대그래프에 텍스트 정보(빈도수)를 추가하는 방법에 대해 설명합니다. 2. 데이터 생성 이번 설명에서 사용할 샘플 데이터를 생성합니다. 아래 코드는 알파벳 A부터 F까지의 총 6개 문자를 랜덤하게 300번 복원 추출하여 data에 저장합니다. LETTERS : 알파벳 A부터 Z까지의 문자가 들어있는 시스템 변..
해당 포스트는 R에서 막대 그래프를 출력할 때, x축 레이블과 색상을 추가하는 방법에 대해 소개합니다. 참고 : [R] R에서 사용 가능한 색상 이름 목록 (R colours) INTRO R에서는 barplot() 함수를 이용하여 막대 그래프를 출력할 수 있습니다. 해당 함수에 숫자로 된 벡터를 입력해주면 각 벡터에 해당하는 값들이 막대 형태로 시각화되는데, 좀 더 의미있는 시각화를 위해 x축 레이블값과 막대 별 색상을 추가하는 방법을 설명하도록 하겠습니다. 데이터셋 생성 먼저 이번 설명에 사용할 이름별 평균 점수가 저장된 데이터 셋을 생성하겠습니다. mydata
R에서는 이미 지정해 놓은 색상 이름들을 이용하여 다양한 색상 표현이 가능합니다. 해당 포스트에서는 R에서 사용 가능한 색상 이름들을 개인 소장용으로 정리해 보았습니다. INTRO 시각화에서는 색상의 구분도 중요하지만, 톤 변화를 통해서도 다양한 느낌을 전달할 수 있습니다. R에서는 시각화 중요성을 인지하여 색상별 이름 미리 정의해 두었으며, 일반적으로 사용되는 색상 코드(RGB, HEX 등)를 사용하지 않고 색상 이름을 사용하여 간단하게 적용해 볼 수 있습니다. 예시 # 데이터셋 생성 mydata
해당 포스트에서는 R에서 줄기-잎 그림(Stem-and-Leaf Plot)을 출력하는 방법을 소개합니다. 1. INTRO 줄기-잎 그림(Stem-and-Leaf plot)은 통계학에서 통계적 자료를 표(table) 형태와 그래프(Graph) 형태의 혼합된 방법으로 나타내는 시각화를 말하며, R에서 내장 함수인 stem()을 이용해 줄기-잎 그림을 그릴 수 있습니다. 아래에서는 내장 데이터셋인 tree 데이터를 이용해 줄기-잎 그림을 시각화하는 방법을 설명 드리겠습니다. 2. 줄기-잎 그림 그리기 이번에 사용할 tree 데이터는 31그루의 벌목된 검은 벚나무의 지름, 높이, 부피 측정값을 제공이 들어있습니다. Girth(numeric) : Tree diameter (rather than girth, act..
해당 포스트에서는 R에서 혈액형 데이터로 도수분포표와 막대그래프를 출력하는 방법을 소개합니다. INTRO R 분석을 시작하면서 데이터의 분포를 파악하는 첫번째 방법은 빈도를 살펴보는 것입니다. 변수별 빈도를 표형태로 확인하는 경우에는 도수분포표(table)를 사용하고, 해당 결과를 그래프로 표현할 때에는 보통 막대그래프(barchart)를 사용합니다. 아래에서는 가상의 혈액형 데이터를 생성하여 도수분포표와 막대그래프를 출력하는 방법을 설명하겠습니다. 1. 데이터 생성 먼저 30개 혈액형 데이터(A,B,O,AB)를 담고있는 mydata 객체를 생성해 보겠습니다. mydata
해당 포스트에서는 R에서 산점도와 상관계수를 한 차트에 그리는 방법을 소개합니다. 1. INTRO R에는 데이터 분포를 파악하기 위한 산점도(Scatter Plot) 함수와 변수 간 관계를 분석할 수 있는 상관 분석 함수가 있습니다. 보통 탐색적 자료 분석(EDA) 단계에서 두 함수를 사용하게 되는데 아래와 같이 두 결과를 한 차트에 시각화 해주는 함수가 있어 소개드리게 되었습니다. 2. psych 패키지 이용하기 이번에 사용할 psych 패키지는 다양한 기술 통계 함수를 제공하는 패키지로, 해당 패키지에서 제공하고 있는 pairs.panels() 함수를 이용해 산점도와 상관계수를 한 차트에 그려보겠습니다. psych : Procedures for Psychological, Psychometric, an..