해당 포스트에서는 Python 수치 연산에 많이 사용되는 NumPy 인덱싱 4가지 방법을 설명합니다. INTRO 데이터 과학에서 NumPy는 수치 계산을 위해 Python에서 널리 사용되는 라이브러리입니다. NumPy는 대용량 데이터 세트로 빠른 계산을 수행할 수 있어 데이터 과학자들 사이에서 인기가 높은 편이며, 배열에서 특정 데이터를 추출하기 위해서는 NumPy 배열 인덱싱 방법을 아는 것이 중요합니다. 특정 데이터 추출, 슬라이싱, 팬시 인덱싱 및 부울 인덱싱을 포함하여 NumPy를 인덱싱하는 다양한 방법이 있습니다. 아래에서는 NumPy 배열을 인덱싱하는 네 가지 방법을 예시와 함께 설명합니다. 목차 특정 데이터만 추출 슬라이싱(Slicing) 팬시 인덱싱(Fancy Indexing) 불린 인덱싱..
해당 포스트에서는 서울디지털재단(Seoul Digital Foundation)에서 발간한 연구보고서 'ChatGPT 활용사례 및 활용 팁'에 대해 소개합니다. INTRO 최근 ChatGPT는 IT업계를 넘어 전 분야의 세계적인 이슈가 되었습니다. IT업계에 종사하지 않더라도 다양한 매체에서 해당 기술 및 사례들을 언급하고 있다보니 빠른 시간에 많은 사용자 층을 얻게 되었고, NLP 연구자들에게는 급성장한 기술로 인해 자리 보전에 대한 두려움(?)과 희열(?)을 주기도 하였습니다. 많은 관심으로 해당 기술을 활용한 다양한 사례 및 서비스들이 나타나고 있다보니, 서울시에서도 ChatGPT 관련 활용 사례 및 팁에 대한 연구보고서를 공개하였고, 기술에 대한 소개 및 개념부터 프롬프트 사례까지 유..
해당 포스트에서는 R에서 문자열 패턴 검색을 위해 stringr 패키지의 str_detect(), str_subset(), str_which() 함수에 대해 소개합니다. INTRO 앞선 포스트에서는 R에서 문자열 패턴 검색을 위한 방법으로 R 내장 함수인 grepl()과 grep() 함수에 대해 설명하였습니다. 이번 포스트에서는 최근 문자열 검색과 관련된 문제를 다룰 때 많이 사용되는 패키지인 tidyverse의 stringr패키지를 이용하여 동일한 문제를 풀어보겠습니다. tidyverse 패키지? stringr 패키지? tidyverse 패키지는 데이터 분석 및 가공을 위한 유용한 함수를 제공해주는 필수 패키지이며, stringr 패키지는 tidyverse 패키지에서 제공되는 텍스트 처리에 특화된 유용..
해당 포스트에서는 R에서 문자열 패턴 검색을 위한 grep(), grepl() 함수에 대해 소개합니다. INTRO R 프로그래밍에서 grepl()과 grep() 함수는 문자열 검색과 관련된 문제를 다룰 때 많이 사용되는 함수로, 특히, 정규 표현식을 활용하여 특정 문자열을 찾아내거나, 특정 패턴(pattern)을 가진 문자열을 필터링하는데 많이 사용되는 함수입니다. 아래에서는 각 함수에 대해 예시와 함께 설명합니다. grep() vs. grepl() 먼저 grep()와 grepl() 함수 사용 방법에 대해 설명합니다. grep() 함수 grep() 함수는 정규 표현식을 사용하여 문자열 벡터에서 특정 패턴을 가진 문자열의 위치를 찾아주거나 해당 값을 반환할 수 있습니다. grep("apple", y) : ..
이번 포스트는 한경BUSINESS 칼럼 '[이태석의 경영 전략] 이직 시 연봉 협상에서 이기는 방법'을 읽고 정리한 글 입니다. 이직 시 연봉 협상에서 이기려면 상대에 대한 철저한 정보 파악 뒤 임해야 실패 가능성을 낮출 수 있다. 요구와 욕구를 구분할 줄 알아야 한다 해당 글은 협상에서 요구와 욕구를 구분할 줄 알아야 한다는 것을 강조하며 시작합니다. 누구나 협상에서 적절한 타이밍에 치고 빠져야 한다는 것은 알고 있지만 쉽지 않은 일이며, 협상을 하기 전에 상대에 대한 정보를 미라 파악하는 것은 매우 중요합니다. 또한, 협상의 마지노선을 파악하고 요구와 욕구를 구분하는 것이 필수이며, 무조건 밀어붙이는 것보다는 상호작용적으로 움직여야 한다는 것을 알아야 합니다. 이태석 님의 글에서는 협상..
해당 포스트에서는 R에서 특정 열을 범주형 변수(as.factor)로 변환하고 이를 활용하여 데이터셋을 분할하는 방법을 소개합니다. INTRO R에서는 다양한 데이터셋 분할 방법이 있습니다. 이 포스트에서는 특정 컬럼을 범주형 변수로 변환하여 범주에 맞게 데이터셋을 분할하는 방법에 대해 샘플 데이터와 함께 설명합니다. 데이터셋 분할하기 1. 샘플 데이터 생성 먼저, data.frame() 함수를 사용하여 mydf 데이터 프레임을 만듭니다. 이 데이터 프레임은 Lake, Year, Count 세 가지 열(column)을 가지며, 각각의 열에는 A, B, C라는 세 개의 Lake, 2011년과 2012년, 그리고 각 호수와 연도에 따른 물고기 수(Count)가 포함되어 있습니다. mydf
이번 포스트는 이코노미조선(Economy Chosun)에서 발간한 '신수정의 리더십 통찰 10탄 : 리더의 무관심이 성공 비결이 될 수도 있다'을 읽고 정리한 글입니다. 리더의 무관심도 하나의 스킬 조직 내에서 리더는 많은 책임과 역할을 가지고 직원과 업무를 항시 관리해야 합니다. 리더는 직원 업무에 대한 무관심한 태도가 직원들의 불만을 만들고 일의 진행을 늦어지게 하는 등 부정적인 영향을 미칠 거라 생각할 수 있지만, 반대로 일부 업무에서 무관심한 태도를 보일 때 일의 흐름이 더욱 원활해지는 경우도 있습니다. 이는 직원들에게 업무 자율성을 부여하고, 일의 우선순위를 스스로 판단하게 함으로써 더욱 효율적인 결과를 이끌어낼 수 있기 때문입니다. 신수정님의 글에서는 "조직 또는 리더의 무관심이..
해당 포스트에서는 네이버 지식인을 통해 질문 받은 반복문을 이용한 특정 출력 방법(3,5,7,9,11 트리 구조 출력)에 대해 설명합니다. INTRO R의 대표적인 반복문에는 for(), while(), repeat() 문이 있습니다. 각 반복문은 유사하게 동작하지만 조금씩 다른 사용법을 가지고 있으며, 아래에서는 네이버 지식인에서 질문받은 문제를 이용하여 예시와 함께 설명합니다. 반복문 비교 아래 세 가지 반복문은 각각의 특성에 따라 적합한 상황이 있으며, 적절히 활용하는 것이 중요합니다. for문은 리스트나 벡터와 같은 순차적인 데이터를 처리하는 경우에 유용하며, while문은 반복 조건에 따라 반복 횟수가 결정되는 경우에 적합합니다. 반면, repeat문은 무한 반복문으로, 반복을 중단할 조건이 명..
해당 포스트는 데이터 프레임(Data Frame)의 특정 컬럼을 기준으로 그룹 합계(Group Sum)을 계산하는 방법을 소개합니다. INTRO R에서 그룹합(Group Sum)을 계산하는 경우는 집단별 합계, 성별 인원 합계, 연령대 소득 합계 등 다양합니다. 아래에서는 R에서 제공되는 다양한 그룹합(Group Sum) 함수들 중, 추가 설치 없이 사용 가능한 aggreate() 함수에 대해 설명하고 예시 데이터와 함께 간단한 풀이를 진행합니다. aggregate? aggregate()는 데이터를 하위 집합으로 분할하여, 각각에 대한 요약 통계를 계산하고 편리한 형식으로 결과를 반환해주는 함수입니다. 함수 사용법 aggregate(x, FUN, …, simplify = TRUE, drop = TRUE)..
해당 포스트에서는 R에서 숫자 데이터 범위에 따라 그룹을 지정하는 방법에 대해 소개합니다. INTRO ifelse() 함수는 R 프로그래밍 언어에서 자주 사용되는 함수 중 하나로, 간단한 조건문을 작성할 때 사용되며, if-else 문의 간단한 버전이라고 생각하시면 됩니다. 자주 사용되는 함수이기도 하지만, 쉽게 사용할 수 있어 간단한 예시 몇 개만 익히신다면 금방 마스터하실 수 있습니다. 아래에서는 간단한 예시와 함께 코드 사용 방법에 대해 설명합니다. 문제 풀어보기 먼저, 0부터 12까지의 정수를 갖는 숫자 벡터인 mydata를 생성하고, 이를 출력해 보겠습니다. # 숫자 벡터 생성 mydata = 10, "a", NA)))) [1] "d" "d" "d" "c" "c" "c" "b" "b" "b" "..