해당 포스트에서는 네이버지식인을 통해 질문받은 EMP 급여 데이터 분석 방법에 대해 설명합니다. INTRO 아래에서는 EMP 벡터를 활용하여 사원들의 급여 정보를 처리하고, 특정 조건을 만족하는 사원들을 출력하는 함수를 정의하여 출력하는 코드를 설명합니다. 해당 과정을 위해 emp_pay()라는 사용자 정의 함수를 생성하여 활용하며, 전체 급여 평균을 계산하고, 이보다 높은 급여를 받는 사원들의 정보를 추출하여 출력합니다. 문제 해결 과정에서는 stringr 패키지의 str_extract()와 str_replace() 함수, 그리고 숫자 변환 함수인 as.numeric()을 사용합니다. 또한, 한글 문자를 인식하는 정규표현식 패턴 [가-힣]을 활용하여 사원의 이름을 추출합니다. 문제 R 코드 아래 함수 ..
해당 포스트에서는 2023년을 마무리하며 한 해 인기있었던 최고의 오픈소스 소프트웨어 25선을 소개하는 글을 읽고 정리한 글입니다. INTRO 연말이 다가오니 한 해를 돌아보는 컨텐츠들이 나타나기 시작합니다. 뉴스를 보던 중, 2023년 최고의 오픈소스 소프트웨어 25선을 소개하는 글을 보고, 개인적으로 관심이 가는 몇몇 소프트웨어를 추려 정리해 보았습니다. 제가 사용하고 있거나 추가정보를 알고 있는 경우에는 추가 메모해 두었으니 보시는 분들에게 도움이 되었으면 좋겠습니다. 소개 BOSSIE 2023 | 올해 최고의 오픈소스 소프트웨어 25선 https://www.itworld.co.kr/news/312096 위 자료는 올해 오픈소스 소프트웨어 25선을 소개하는 내용으로, 제가 평소 접하고 있는 Data..
해당 포스트에서는 R언어의 대표적인 웹앱 서비스인 Shiny가 대표 오픈소스 재단인 Hugging Face와 함께 Python 지원을 시작한 내용에 대해 소개합니다. Shiny 란? Shiny는 R에서 웹 어플리케이션을 쉽게 만들고 배포할 수 있도록 개발된 프로그램입니다. 오랜시간 R언어의 큰 장점으로 유지되었었는데, 최근 Python을 지원하기 시작했다고 발표되었습니다. Python에는 이미 Django, Flask, FastAPI, Streamlit 등 다양한 웹앱 라이브러리들이 있지만, 최근 멀티언어가 요구되는 데이터 과학자들에게는 선택의 폭이 넓어졌다고 생각되며, 저와 같이 R로 시작하여 Python에 입문한 사람들에게는 좀 더 친숙하게 개발할 수 있을 것으로 생각됩니다. 아래는 제가 원문을 통해..
해당 포스트는 루비페이퍼에서 출간한 '101가지 문제로 배우는 딥러닝 허깅페이스 트랜스포머 with 파이토치'를 읽고 작성한 서평입니다. INTRO 허깅페이스(Hugging Face)는 미국의 인공지능 스타트업으로 트랜스포머와 같은 모델 또는 데이터셋들을 제공하는 세계 최대 인공지능 플랫폼 중 하나입니다. 특히, 이 책에서 집중해서 다루는 트랜스포머(transformer)는 구글에서 개발한 모델로 최근 이슈가 되고 있는 ChatGPT와 같은 LLM(Large Language Model)의 근본이 되는 모델입니다. 최근 ChatGPT로 관심을 받고 있는 다양한 언어 처리 기술들을 코랩(Colab) 실습을 통해 누구나 쉽게 학습할 수 있도록 구성되어 있어, 이론보다는 실습을 통해 배우고자 하시..
이번 포스트는 한경BUSINESS 경영전략 섹션 '‘목표 수립’만 잘해도 조직의 성과가 높아진다'을 읽고 정리한 글 입니다. 출처 : [경영 전략]‘목표 수립’만 잘해도 조직의 성과가 높아진다 회사는 구성원을 인간으로 대하고 그들이 성장하고 이바지할 기회를 책임지고 제공해야 한다 직장인에게 목표 수립, 성과 평가 등 성과 관리는 매년 하고 있지만 어떻게 해야 제대로 하는건지 의문이 남는 어려운 부분입니다. 최근 자유로운 근무 환경에 따라 성과 중심의 평가로 바뀌는 상황에서, '어떻게 해야 개인의 성공을 조직의 성공과 연결하고 달성할 수 있을지'는 직장인들의 고민을 더욱 깊어지게 합니다. 아래에서는 이런 고민을 가진 분들을 위해 몇가지 예시와 함께 목표 수립 방법, 성과 측정 ..
이번 포스트에서는 R 마크다운에서 코드 에러가 있을 경우 HTML파일 출력이 되지 않는 문제를 해결하는 방법을 설명합니다. 현상 R 마크다운에서 HTML을 출력하려 하는데, 코드에 에러가 있어 출력되지 않는 상황 ex) 코드 오류, 데이터 오류, 패키지 오류 등 해결 코드 수정이 불가능한 상황이라 코드 수정이 불가능하다면, 코드 청크(chunk)의 eval 옵션을 이용 eval 옵션의 기본값을 TRUE로 코드 청크를 기본 실행하게 되어 있는데, 해당 옵션 값을 FALSE로 입력하면 해당 청크는 실행되지 않고 출력만 됨 결과 eval = FALSE 옵션 적용결과 정상 HTML 생성 및 출력되는 것을 확인함!
해당 포스트에서는 R에서 벡터(vector)의 모든 값이 동일한지 확인하는 방법에 대해 설명합니다. INTRO R에서 벡터(vector)는 단일 값 또는 값의 집합을 저장하는 데 사용되는 데이터 유형 중 하나로, 기본 구조이면서 가장 많이 사용되는 자료 구조입니다. 아래에서는 벡터(vector)의 모든 요소(값)가 동일한지 확인하는 방법에 대해 설명합니다. 코드 설명 R에는 벡터 내 값들의 동일성 판단을 위한 다양한 방법이 있습니다. 아래에서는 크게 1) 모든 원소의 값이 동일한지, 2) 모든 원소의 값이 특정값과 같은지 를 구분하여 설명합니다. 모든 원소의 값이 동일한지 : length()와 unique() 모든 원소의 값이 특정값과 동일한지 : all(), all.equal() 1. 모든 원소의 값이..
해당 포스트에서는 리스트(list)에서 원하는 문자 벡터를 선택하여 문자열로 만드는 방법을 소개합니다. INTRO 리스트(list)는 R에서 데이터를 저장하는 방법 중 하나로, 데이터 프레임(Data Frame)과 다르게 여러 가지 타입의 데이터를 저장할 수 있습니다. 아래에서는 리스트(list) 안에 문자열 벡터를 저장하고, 해당 벡터에서 원하는 값을 선택하여 문자열로 만드는 방법을 간단한 예시와 함께 설명합니다. R 코드 및 설명 먼저 설명에 사용할 str1이라는 빈 리스트(list)를 생성합니다. 그 다음 str1 리스트 안에 4thelement라는 이름으로 문자열 벡터 c('I', 'love', 'R')를 추가하고, 마지막으로 paste() 함수를 사용하..
이번 포스트는 한경BUSINESS 경영전략 섹션 '새로운 리더십이 필요한 MZ세대'을 읽고 정리한 글 입니다. 출처 : 새로운 리더십이 필요한 MZ세대[이태석의 경영 전략] 상황에 맞춰 수시로 변하는 ‘유연한 리더십’ 갖춰야 MZ세대는 디지털 시대의 변화와 함께 성장한 세대입니다. 그들은 과거와는 다른 가치관과 생각을 가지고 있으며, 새로운 리더십을 요구하고 있습니다. 이제는 예전처럼 지시하고 명령하는 리더십이 아니라, 존중하고 인정하는 리더십이 필요합니다. 또한 혁신적인 아이디어와 역량을 인정하고 지원하는 것도 중요합니다. 이 글에서는 MZ세대가 요구하는 새로운 리더십의 특징과 필요성에 대해 논의하고자 합니다. 서론 요즘 세대는 상하 관계가 엄격한 조직을 싫어한다. 같은 일을 하더라도 좀..
해당 포스트에서는 1부터 100까지 출력하면서 3의 배수는 별(star)로 출력하는 방법을 소개합니다. [R] 1부터 100까지 출력하면서 3의 배수는 별(star)로 출력하기 INTRO 반복문은 프로그래밍을 공부하는 사람들에게 가장 요청이 많은 연습문제 중 하나입니다. 특히, 책에서 나오는 다양한 별(*) 출력 예제는 반복문을 이용한 변환 문제를 연습할 수 있어서 가장 많은 문제 중 하나입니다. 아래에서는 별표(*) 출력 예제 중 하나를 다뤄보겠습니다. [Python] 별 출력 예제 (사용자 line수 입력) 질문 1부터 100까지의 숫자를 출력하되, 3의 배수를 별표(`*`)로 출력하세요. 풀이 아래 코드는 주어진 조건에 따라 Python 조건문과 반복문을 이용하여 1부터 100까지의 숫자 중 3의 ..