기록은 지식이 되고, 배움의 기회를 만든다.
close
프로필 배경
프로필 로고

기록은 지식이 되고, 배움의 기회를 만든다.

  • 분류 전체보기 (339)
    • DataScience (194)
      • AI (2)
      • Python (27)
      • R (59)
      • Database (2)
      • OS (10)
      • Tools (12)
      • R 프로그래밍 (82)
    • Knowledge (72)
      • Leadership (15)
      • Research (34)
      • 데이터분석자격증(ADP) (23)
    • Life (73)
      • Blog (8)
      • Book (57)
      • Product (4)
      • Useful (4)
  • 홈
  • 리더십
[R] R에서 반응 변수 비율에 맞춰 데이터셋 분할하기 (15회 ADP 실기 기출)

[R] R에서 반응 변수 비율에 맞춰 데이터셋 분할하기 (15회 ADP 실기 기출)

해당 포스트는 R에서 효율적인 데이터셋 분할 방법 을 설명하는 글입니다. '15회 데이터 분석 전문가(ADP) 실기시험'에 데이터 마이닝 과목 세부 문제로 출제되었습니다. 지난 ADP 15회 실기시험 의 데이터 마이닝 과목 1번 문제는 종속 변수의 비율이 train:valid:test = 6:2:2 가 되도록 데이터셋을 분할하는 문제였습니다. 시험에서는 caret::createDatapartition 함수 사용에 실수가 있어 sample()함수로 해결하였으나 복기하다보니 문제가 해결되어 정리하였습니다. 1. sample() 함수 접근 아래와 흔히 sample() 함수를 이용하는 매 시행에 랜덤 추출이 적용되며, 데이터 셋이 동일한 비율로 분할되지만 종속 변수의 비율이 일정하지 않습니다. 데..

  • format_list_bulleted DataScience/R 프로그래밍
  • · 2020. 11. 30.
  • textsms
  • navigate_before
  • 1
  • navigate_next
공지사항
  • 블로그 소개 및 저작권에 관하여
  • ADP 실기시험 기출 모음 (22.02.21)
전체 카테고리
  • 분류 전체보기 (339)
    • DataScience (194)
      • AI (2)
      • Python (27)
      • R (59)
      • Database (2)
      • OS (10)
      • Tools (12)
      • R 프로그래밍 (82)
    • Knowledge (72)
      • Leadership (15)
      • Research (34)
      • 데이터분석자격증(ADP) (23)
    • Life (73)
      • Blog (8)
      • Book (57)
      • Product (4)
      • Useful (4)
인기 글
최근 글
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바