해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHubtidyversetidyverse는 효율적인 R분석을 위하여 다양..
이 포스팅은 Kaggle의 California Housing Prices 문제 풀이를 따라 연습한 글입니다.출처 : Kaggle - California Housing PricesINTRO해당 Competition은 1990년 캘리포니아 인구조사 데이터인캘리포니아 주택 가격(California Housing Prices)데이터셋을 사용하며, 학습을 통해 주택 가격(median)을 예측하는 문제입니다.Step 1. Load in the data1.1 패키지 및 데이터 불러오기변수 설명longitude : 경도latitude : 위도housing_median_age : 주택 나이 (중앙값)total_rooms : 전체 방 수total_bedrooms : 전체 침실 수population : 인구household..
이 글은 Kaggle에서 좋은 평가를 받은 kernel을 따라하며 학습한 내용입니다.Kaggle Linear Regression : Randomly created dataset for linear regressionR notebook using data from Linear Regression by zohan선형 회귀 분석은 한 개 이상의 입력 변수(X)들을 기반으로 하나의 반응 변수(Y)를 예측하는데 활용됩니다.입력 변수와 반응 변수의 선형 관계(수학적 공식) 수립의 목적은 입력 변수(X)들을 알고 있을 때, 공식을 이용하여 반응 변수(Y)를 추정하는데 있습니다.1. 패키지 및 데이터 불러오기분석을 시작하기 앞서, 데이터를 불러오고 분석에 필요한 패키지를 로드하는 단계입니다.데이터는 아래 첨부된 링크에..
프로그래밍 공부를 위해 Projetct Euler의 문제 풀이를 연습하는 내용입니다.문제(problem), 제 답변(answer), 추천하는 타인 답변(solution)으로 구성되어 있습니다.기본적으로 풀이는 R을 사용하였지만, 일부 연습을 위해 Python으로도 구현해 보았습니다.Problem번호 : 4제목 :세자리 수를 곱해 만들 수 있는 가장 큰 대칭수설명 :앞에서부터 읽을 때나 뒤에서부터 읽을 때나 모양이 같은 수를 대칭수(palindrome)라고 부릅니다.두 자리 수를 곱해 만들 수 있는 대칭수 중 가장 큰 수는 9009 (= 91 × 99) 입니다.세 자리 수를 곱해 만들 수 있는 가장 큰 대칭수는 얼마입니까?Answer & Solution - R어떤 수(n)에 대하여 대칭수인지 판단하는 함수..
프로그래밍 공부를 위해 Projetct Euler의 문제 풀이를 연습하는 내용입니다.문제(problem), 제 답변(answer), 추천하는 타인 답변(solution)으로 구성되어 있습니다.기본적으로 풀이는 R을 사용하였지만, 일부 연습을 위해 Python으로도 구현해 보았습니다.Problem번호 : 3제목 :가장 큰 소인수 구하기설명 :어떤 수를 소수의 곱으로만 나타내는 것을 소인수분해라 하고, 이 소수들을 그 수의 소인수라고 합니다.예를 들면 13195의 소인수는 5, 7, 13, 29 입니다.600851475143의 소인수 중에서 가장 큰 수를 구하세요.Answer & Solution - R어떤 수(num)를 인자로 받아 소인수 집합(num_list)을 구하는 함수 작성2부터 어떤 수(num)까지..
프로그래밍 공부를 위해 Projetct Euler의 문제 풀이를 연습하는 내용입니다.문제(problem), 제 답변(answer), 추천하는 타인 답변(solution)으로 구성되어 있습니다.기본적으로 풀이는 R을 사용하였지만, 일부 연습을 위해 Python으로도 구현해 보았습니다.Problem번호 : 2제목 :피보나치 수열에서 4백만 이하이면서 짝수인 항의 합설명 :피보나치 수열의 각 항은 바로 앞의 항 두 개를 더한 것이 됩니다. 1과 2로 시작하는 경우 이 수열은 아래와 같습니다.1, 2, 3, 5, 8, 13, 21, 34, 55, 89, ...짝수이면서 4백만 이하인 모든 항을 더하면 얼마가 됩니까?Answer & Solution - R피보나치 수열을 구하는 함수를 구현 : 특정 값까지 바로 앞..
프로그래밍 공부를 위해 Projetct Euler의 문제 풀이를 연습하는 내용입니다.문제(problem), 제 답변(answer), 추천하는 타인 답변(solution)으로 구성되어 있습니다.기본적으로 풀이는 R을 사용하였지만, 일부 연습을 위해 Python으로도 구현해 보았습니다.Problem번호 : 1제목 :1000보다 작은 자연수 중에서 3 또는 5의 배수를 모두 더하면?설명 :10보다 작은 자연수 중에서 3 또는 5의 배수는 3, 5, 6, 9 이고, 이것을 모두 더하면 23입니다.1000보다 작은 자연수 중에서 3 또는 5의 배수를 모두 더하면 얼마일까요?Answer & Solution - R1부터 1000까지 1씩 증가(i)3 또는 5로 나누었을때, 나머지가 0인 경우 해당 수(i)를 총합(s..
오프라인에서 R 및 RStudio Server 의 설치 및 환경 설정을 돕기 위한 글입니다.설명에 앞서, 이 글은 2년전에 작성하였던 글을 공유하는 것이기에 버전이 낮을 수 있습니다.계정, 경로, 버전 등의 정보는 필요한 상황에 맞추어 수정하시면 됩니다.1. R 설치R공식사이트(https://cran.r-project.org/)에 접속하여 R-3.2.2.tar.gz 파일을 다운받는다.받은 파일을 서버에 저장하고 압축을 풀어준다.tar -zxvf R-3.2.2.tar.gz -C /home/mhyang/R\# tar -zxvf R-3.2.2.tar.gz -C R설치경로압축이 풀리면 설치된 폴더로 접근하여 다음 명령어를 차례로 입력한다.cd /home/mhyang/R/R-3.2.2./configure --e..
R에서 주성분 분석(PCA) 시 활용할 수 있는 사용자 정의 함수(UDF)를 소개하는 글입니다.R에서 주성분 분석(PCA)을 수행하기 위해 검색하던 중 분석을 조금 더 편하게 할 수 있는 사용자 정의 함수(UDF)를 발견하였고,범용적으로 활용할 수 있도록 함수를 변경하여 개인 소스코드 목록에 추가하였습니다.이 포스트는 사용자 정의 함수(UDF)에 관한 글이기에 주성분 분석에 대해 알고 싶으신 분은 링크를 참고하시면 됩니다.1. 원본(수정 전) 변수에 대한 설명력의 누적기여율(cummulative proportion)이 80%가 되는 주성분의 개수 k개를 찾아서, 주성분 1번부터 주성분 k번째까지의 주성분점수를 반환하는 사용자 정의함수는 아래와 같습니다.#----------------------------..