해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHub3. 함수(Functions)3.1 함수 이름 생성(Naming)..
해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHub2. 문법(Syntax)2.3 함수 호출(Function call..
해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHub2. 문법(Syntax)2.1 객체 이름(Object names)..
해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHub1. 파일(Files)1.1 이름(Names)파일 이름은 의미를 ..
해당 포스트는 Hadley Wickham이 작성한 'The tidyverse style guide' 를 번역하여 정리한 글입니다.ListsIntro - 0. WelcomeAnalysis - 1. FilesAnalysis - 2. Syntax (1)Analysis - 2. Syntax (2)Analysis - 3. FunctionsAnalysis - 4. PipesAnalysis - 5. ggplot2Packages - 6. FilesPackages - 7. DocumentationPackages - 8. TestsPackages - 9. Error messagesPackages - 10. NewsPackages - 11. Git/GitHubtidyversetidyverse는 효율적인 R분석을 위하여 다양..
R-bloggers에서 흥미로운 컨텐츠를 찾아 소개하는 포스트 입니다. 이번 포스트에서는 'R에서 실행 시간(running time)을 계산하는 5가지 방법'을 소개합니다. 개요 R에서 실행 시간을 측정하는 방법은 크게 2가지로, 시스템 함수를 이용하는 방법과 외부 패키지를 이용하는 방법이 있습니다. 아래에서는 두 분류에 포함되는 총 5가지 함수 및 패키지의 사용방법을 소개하며 마지막엔 간략한 결론을 제시합니다. 1. Using Sys.time Sys.time()은 시스템 함수로 현재 시스템 시간을 출력하는 함수이며, 코드 청크의 시작과 끝의 시간 차이를 측정하여 측정 할 수 있습니다. 사용법 01 | start_time
CentOS 에서 CPU 코어별 사용량을 확인하는 방법에 대한 포스트 입니다.회사에서 사용하는 분석 서버는 다수의 사용자가 작업을 수행하고 있습니다. 사용을 유연하게 하고자 계정별 물리적인 제한을 두지 않고 파이썬 스크립트 내에서 scikit-learn의 n_jobs 파라미터를 조절해 가며 사용하고 있습니다.ex1) 전체 코어 수 = 72개 → 8명 사용 : n_jobs = 9 설정ex2) 전체 코어 수 = 72개 → 3명 사용 : n_jobs = 24 설정동시 접속자 수가 많지 않거나 특정 이슈로 빠른 처리가 필요한 경우 리소스 몰아주기를 하는데, 가끔 확인되지 않은 작업이 있을 수 있기에 반드시 사전 확인을 해야 합니다.ex) 대용량 학습, 배치 작업 등리눅스에서 기본적으로 제공하는 top 명령어로 ..
하단 내용은 Python에서 Django 세팅을 하면서 발생한 에러 조치에 관한 글 입니다. 1. 문제 상황 Python 에서 django 설치 후 manage.py를 이용하여 runserver 실행시 에러 발생 [1] Windows 10 에서 실행 명령어 : python manage.py runserver Error Message : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbf in position 0: invlid start byte 2. 원인 파악 컴퓨터 이름이 한글('우리집컴퓨터')로 작성되어 있었고 이를 내부에서 변환하는 과정으로 오류 발생 3. 조치 내용 온라인 검색 결과, HostName 이 한글이면..
이 포스팅은 Kaggle의 California Housing Prices 문제 풀이를 따라 연습한 글입니다.출처 : Kaggle - California Housing PricesINTRO해당 Competition은 1990년 캘리포니아 인구조사 데이터인캘리포니아 주택 가격(California Housing Prices)데이터셋을 사용하며, 학습을 통해 주택 가격(median)을 예측하는 문제입니다.Step 1. Load in the data1.1 패키지 및 데이터 불러오기변수 설명longitude : 경도latitude : 위도housing_median_age : 주택 나이 (중앙값)total_rooms : 전체 방 수total_bedrooms : 전체 침실 수population : 인구household..
이 글은 Kaggle에서 좋은 평가를 받은 kernel을 따라하며 학습한 내용입니다.Kaggle Linear Regression : Randomly created dataset for linear regressionR notebook using data from Linear Regression by zohan선형 회귀 분석은 한 개 이상의 입력 변수(X)들을 기반으로 하나의 반응 변수(Y)를 예측하는데 활용됩니다.입력 변수와 반응 변수의 선형 관계(수학적 공식) 수립의 목적은 입력 변수(X)들을 알고 있을 때, 공식을 이용하여 반응 변수(Y)를 추정하는데 있습니다.1. 패키지 및 데이터 불러오기분석을 시작하기 앞서, 데이터를 불러오고 분석에 필요한 패키지를 로드하는 단계입니다.데이터는 아래 첨부된 링크에..