해당 포스트는 R에서 행렬(matrix)을 생성할 때 사용되는 byrow 옵션에 대해 설명 합니다. 1. INTRO R에서 2차원 형태의 데이터를 생성할 때에는 주로 행렬(Matrix)이나 데이터 프레임(Data Frame)을 사용하게 됩니다. 그 중에서도 숫자로만 이루어진 경우, 행렬(Matrix)을 주로 사용하게 되는데 이 때 자주 사용하는 byrow 옵션에 대해 설명합니다. 2. R에서 행렬(matrix) 생성 일반적으로 R에서 행렬(Matrix)을 생성하려 할 때에는 시퀀스 숫자를 바로 사용하거나 임의의 벡터를 생성 후 사용합니다. 아래는 동일한 행렬을 생성하는 다른 방식의 예시입니다. 1) 연속된 숫자로 행렬 생성 matrix(1:9, nrow = 3) [,1] [,2] [,3] [1,] 1 4..
해당 포스트에서는 파이썬(Python)을 이용하여 HTML 태그(tag) 정보들을 추출하는 방법에 대해 설명합니다. 1. INTRO 웹 크롤링(Web Crawling)을 통해 수집한 HTML 파일에서 태그(tag)들을 추출하는 방법에 대해 설명합니다. 파이썬(Python)이 오픈 소스 언어이다 보니 다른 분들이 만들어 놓은 tag 추출 라이브러리들이 있을 수 있으나, 이번 포스트에서는 일반적으로 많이 사용하는 정규표현식을 이용하는 방법에 대해 설명합니다. 2. 샘플 데이터 생성 이번 설명에서 사용할 HTML 형식을 갖춘 텍스트 데이터를 생성합니다. testtext1 = """ My favorite website in the world is probably Udacity. If you want that l..
해당 포스트에서는 R에서 랜덤 데이터 샘플링(추출)방법에 대해 설명합니다. 1. INTRO R에서 랜덤 데이터 추출이 필요한 경우, 내장 함수인 sample()과 dplyr 패키지의 sample_n(), sample_frac() 함수를 사용할 수 있습니다. 아래에서 각 함수의 설명과 사용법을 설명하니 상황에 따라 필요한 함수를 사용하시면 됩니다. 참고 아래 예시에서 설명하는 함수들은 무작위 추출되기에 출력 결과가 다를 수 있는 점 참고 부탁드립니다. 2. sample() sample()은 R에서 제공되는 내장 함수로 별도의 설치가 필요하지 않습니다. sample() 함수는 난수를 추출해주는 함수로 입력 인자값 차이에 따라 각각 다른 결과값을 리턴합니다. 아래 3가지 예시를 준비하였으니 보시고 사용법을 참..
해당 포스트에서는 R에서 데이터 정렬 방법(order(), arrange())에 대해 설명합니다. 1. INTRO R에서 데이터 정렬이 필요한 경우, 내장 함수인 order()와 dplyr 패키지의 arrange() 함수를 많이 사용합니다. 아래에서는 두 함수의 사용 방법을 설명하니 상황에 따라 필요한 함수를 골라 사용하시면 됩니다. 2. order() order()은 R에서 제공되는 내장 함수로 별도의 설치가 필요하지 않습니다. order() 함수만 단독으로 쓰는 경우, 각 값의 순위(rank)가 리턴되기에 일반적으로는 아래와 같이 변수 내 인덱싱에 적용하여 정렬하는데 사용됩니다. mylist 생성 mylist % arrange(mpg) mpg cyl disp hp drat wt qsec vs am g..
내 블로그 - 관리자 홈 전환 |
Q
Q
|
---|---|
새 글 쓰기 |
W
W
|
글 수정 (권한 있는 경우) |
E
E
|
---|---|
댓글 영역으로 이동 |
C
C
|
이 페이지의 URL 복사 |
S
S
|
---|---|
맨 위로 이동 |
T
T
|
티스토리 홈 이동 |
H
H
|
단축키 안내 |
Shift + /
⇧ + /
|
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.