해당 포스트에서는 네이버지식인을 통해 질문받은 EMP 급여 데이터 분석 방법에 대해 설명합니다.INTRO아래에서는 EMP 벡터를 활용하여 사원들의 급여 정보를 처리하고, 특정 조건을 만족하는 사원들을 출력하는 함수를 정의하여 출력하는 코드를 설명합니다. 해당 과정을 위해 emp_pay()라는 사용자 정의 함수를 생성하여 활용하며, 전체 급여 평균을 계산하고, 이보다 높은 급여를 받는 사원들의 정보를 추출하여 출력합니다.문제 해결 과정에서는 stringr 패키지의 str_extract()와 str_replace() 함수, 그리고 숫자 변환 함수인 as.numeric()을 사용합니다. 또한, 한글 문자를 인식하는 정규표현식 패턴 [가-힣]을 활용하여 사원의 이름을 추출합니다.문제R 코드아래 함수 emp_pa..
이번 포스트에서는 R 마크다운에서 코드 에러가 있을 경우 HTML파일 출력이 되지 않는 문제를 해결하는 방법을 설명합니다.현상R 마크다운에서 HTML을 출력하려 하는데, 코드에 에러가 있어 출력되지 않는 상황ex) 코드 오류, 데이터 오류, 패키지 오류 등 해결코드 수정이 불가능한 상황이라 코드 수정이 불가능하다면, 코드 청크(chunk)의 eval 옵션을 이용eval 옵션의 기본값을 TRUE로 코드 청크를 기본 실행하게 되어 있는데, 해당 옵션 값을 FALSE로 입력하면 해당 청크는 실행되지 않고 출력만 됨결과eval = FALSE 옵션 적용결과 정상 HTML 생성 및 출력되는 것을 확인함!
해당 포스트에서는 R 반복문을 활용해 1부터 100까지 출력하면서 3의 배수는 별(start)로 출력하는 방법을 설명합니다.INTROR 프로그래밍을 공부하시는 분들에게 반복문은 가장 많이 요구되는 연습중 하나입니다. 특히, 반복문을 이용한 다양한 별(*) 출력 예제는 대부분 도서에서 출제되는 문제이며, 이를 통해 다양한 변형 문제들을 해결하는 연습을 하게 됩니다. 아래에서는 별(*) 출력 예제 중 하나를 설명합니다.[R] 반복문을 이용한 별 출력 예제 1탄 (feat. 직각삼각형, 피라미드)[R] 반복문을 이용한 별 출력 예제 2탄 (feat. 다이아몬드, 마름모, 나비, 모래시계)문제1부터 100까지 출력하면서 3의 배수는 별(*)로 출력하시오.풀이아래에서는 주어진 조건에 맞춰 풀이하기 위해, R 조건..
해당 포스트는 네이버지식인을 통해 질문받은 'RStudio 그래프 팝업창 안 뜨게 하는 방법'에 대한 답변을 공유하는 글입니다. 질문 RStudio 그래프를 출력하면 사진처럼 옆에 R 프로그램에서 나온느게 아니라 따로 팝업창으로 나옵니다... 불편해서 바꾸고 싶은데 어떻게 바꾸나요? 풀이RStudio에서는 그래픽 설정을 통해 출력 결과를 다양하게 표현할 수 있습니다. 질문 상황은 이전 코드 어디에선가 그래픽 출력창을 생성하는 x11()이 실행되었고, 이로 인해 그래픽 출력 결과가 내부가 아닌 팝업으로 생성된 출력창에 출력되는 상황인 것으로 보입니다.이러한 상황은 dev.off() 명령어 실행으로 간단히 해결 가능하며, 아래에서는 두 명령어에 대한 설명과 간단한 테스트 코드를 설명합니다.1. x11()x..
해당 포스트에서는 R에서 문자열 패턴 검색을 위해 stringr 패키지의 str_detect(), str_subset(), str_which() 함수에 대해 소개합니다.INTRO앞선 포스트에서는 R에서 문자열 패턴 검색을 위한 방법으로 R 내장 함수인 grepl()과 grep() 함수에 대해 설명하였습니다. 이번 포스트에서는 최근 문자열 검색과 관련된 문제를 다룰 때 많이 사용되는 패키지인 tidyverse의 stringr패키지를 이용하여 동일한 문제를 풀어보겠습니다.tidyverse 패키지? stringr 패키지?tidyverse 패키지는 데이터 분석 및 가공을 위한 유용한 함수를 제공해주는 필수 패키지이며, stringr 패키지는 tidyverse 패키지에서 제공되는 텍스트 처리에 특화된 유용한 필수..
해당 포스트에서는 R에서 문자열 패턴 검색을 위한 grep(), grepl() 함수에 대해 소개합니다.INTROR 프로그래밍에서 grepl()과 grep() 함수는 문자열 검색과 관련된 문제를 다룰 때 많이 사용되는 함수로, 특히, 정규 표현식을 활용하여 특정 문자열을 찾아내거나, 특정 패턴(pattern)을 가진 문자열을 필터링하는데 많이 사용되는 함수입니다.아래에서는 각 함수에 대해 예시와 함께 설명합니다. grep() vs. grepl()먼저 grep()와 grepl() 함수 사용 방법에 대해 설명합니다.grep() 함수grep() 함수는 정규 표현식을 사용하여 문자열 벡터에서 특정 패턴을 가진 문자열의 위치를 찾아주거나 해당 값을 반환할 수 있습니다.grep("apple", y) : y 벡터에서 ..
해당 포스트에서는 R에서 인공신경망(nnet)을 이용해 스팸 필터링 문제를 풀이하는 방법에 대해 설명합니다.INTRO스팸 필터링(Spam Filtering) 문제는 기본적으로 자연어 처리(NLP, Natural Language Processing)를 기반으로 하며, 텍스트 데이터가 숫자(임베딩)로 변환된 후에는 다양한 알고리즘 적용이 가능합니다.아래에서는 인공신경망(ANN)을 사용하여 스팸을 예측하는 분류 문제를 소개합니다. 풀이 절차는 nnet 패키지를 사용하여 모델을 구축하고, 내장된 스팸 데이터셋을 불러와 전처리 한 뒤, 적절한 노드 수를 찾아 모델을 적합시키고 결과를 분석합니다.[참고] 스팸 필터링(Spam Filtering)에 대한 이론적 이해가 필요하신 분은 아래 링크를 참고해 주세요.스팸 필..
해당 포스트에서는 RStudio 시작 시, 작업 환경이 자동 복구되는 기능을 옵션에서 조정하는 방법을 설명합니다.INTRORStudio에서는 작업 환경의 연속성을 위해, 기본적으로 작업 종료 시 환경을 저장하고, 다음 작업에서는 이전 환경을 자동으로 불러올 수 있게 기능이 제공되고 있습니다. 하지만 작업 연속성이 필요없거나 이전 작업의 불필요한 메모리 사용이 있었다면 이러 기능은 일반 사용자 분들에게는 오히려 불편하게 다가올 수 있습니다.아래에서는 RStudio 작업 환경 자동 복구 기능을 끄거나 키는 방법에 대해 설명합니다. 질문 Rstudio를 사용하고 껐다가 다음날 키면 전에 썼던 내용이 그대로 뜨는 이유는 뭔가요?? 어떻게 하면 다음날 켜도 전에 했던 것들이 안뜨나요?? 답변RStudio는 실행 ..
해당 포스트에서는 posit(formerly RStudio) Engineer가 발표한 'R 파일명을 정의하는 방법'에 대해 소개합니다.INTRO파일명을 정의하는 방법에는 다양한 방법이 있고, 개인마다 스타일이 있습니다. 하지만, 분석가나 개발자의 경우, 기계가 좀 더 잘 이해할 수 있고, 분석에 좀 더 잘 활용할 수 있으며, 타인이 봐도 직관적으로 이해할 수 있는 스타일로 파일명을 정의하는 것이 생산성 및 효율성을 높이는 방법 중 하나라고 생각합니다. 아래에서는 posit(formerly RStudio) engineer인 Jennifer Bryan이 제안하는 파일명 정의 방법에 대해 정리 및 설명합니다.좋은 파일 이름은...좋은 파일 이름은 아래 3가지 기준을 충족해야 합니다.기계가 읽을 수 있고 (m..
해당 포스트는 R을 활용해 특정 기업의 월별 매출액을 분석하는 방법을 소개합니다.INTRO매출액 분석은 경제, 경영, 통계 등 다양한 학문에서 필요한 기술입니다. 기본적으로 많은 분들이 엑셀(excel)을 이용하여 분석을 수행하고 있지만,프로그래밍을 배우시는 분들을 위해 R을 이용해 월별 매출액을 입력하고 분석하는 방법에 대해 설명합니다.문제풀이1. 매출액 분석을 위해 자료를 sales에 저장합니다.R에서 매출액을 sales 변수에 저장하기 위해서는 c() 함수를 이용하면 됩니다.c() : 괄호 안에 값들을 묶어 벡터를 생성합니다.names() : sales 변수의 각 값에 이름을 부여해 줍니다.sales 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월 400 4..