해당 포스트에서는 posit(formerly RStudio) Engineer가 발표한 'R 파일명을 정의하는 방법'에 대해 소개합니다.INTRO파일명을 정의하는 방법에는 다양한 방법이 있고, 개인마다 스타일이 있습니다. 하지만, 분석가나 개발자의 경우, 기계가 좀 더 잘 이해할 수 있고, 분석에 좀 더 잘 활용할 수 있으며, 타인이 봐도 직관적으로 이해할 수 있는 스타일로 파일명을 정의하는 것이 생산성 및 효율성을 높이는 방법 중 하나라고 생각합니다. 아래에서는 posit(formerly RStudio) engineer인 Jennifer Bryan이 제안하는 파일명 정의 방법에 대해 정리 및 설명합니다.좋은 파일 이름은...좋은 파일 이름은 아래 3가지 기준을 충족해야 합니다.기계가 읽을 수 있고 (m..
해당 포스트에서는 Python(파이썬)에서 발생 가능한 오류의 큰 범주인 구문 오류(Syntax Error)와 의미 오류(Semantic Error)에 대해 설명합니다. 1. 구문 오류 (Syntax Error)유효하지 않은 파이썬 코드를 입력했을 발생하는 오류로, 코드 실행 자체가 되지 않기에 바로 확인 가능한 직관적인 에러입니다.사용하는 IDE(Visual Studio, Pycharm 등)에서 문법 교정 옵션이 활성화되어 있다면 쉽게 해결할 수 있습니다.e.g. 미완성된 코드 실행, 할당문의 문법적 오류 등 2. 의미 오류 (Semantic Error)파이썬이 할 수 없는 명령을 내렸을 때 발생하는 오류로, 수(number)를 0으로 나눈다든지, 존재하지 않는 변수를 사용하는 등의 케이스가 있습니다...
해당 포스트에서는 R에서 데이터 프레임(Data Frame)에 있는 모든 숫자 데이터를 한 번에 '홀수'와 '짝수'로 변환하는 방법에 대해 설명합니다. INTRO R에서 사용되는 기본 자료형(Basic Data Types)은 총 5가지가 있습니다. 그 중에서도 수치형(numeric or integer)과 문자형(character)은 상대적으로 많이 사용되기도 하지만, 데이터 분석 과정에서 변환을 통해 데이터 특성을 다르게 고려해야 하는 경우가 종종 발생합니다. 아래에서는 네이버 지식을 통해 받은 질문 중, 데이터 프레임(Data Frame)에 저장된 모든 숫자를 한 번에 '홀수', '짝수'라는 문자로 변경하는 방법에 대해 설명합니다. 질문 내용 및..
해당 포스트는 R에서 사용자에게 점수를 입력받으면 학점(등급)을 계산하여 출력해주는 방법에 대해 소개합니다. INTRO 사용자에게 점수를 입력받고, 구간에 따라 학점(등급)을 출력해 주는 함수를 생성해 보겠습니다. 간단하지만 기초 단계에 배우는 사용자 입력, 조건문, 반복문까지 필요한 문제이기에 아래 설명을 참고하시어 기초를 이해하시고 활용해 보시면 좋을 것 같습니다. 질문 풀이 1. 문제 파악 먼저, 문제에서 제시된 조건들을 정리하면 아래와 같습니다. 0부터 100사이의 정수 값 입력받기 입력받은 정수를 학점으로 변환 for반복문을 이용하여 5회 반복 readline() 을 사용하여 사용자 입력 받기 입력받은 문자열을 숫자로 변경할 때 as.numeric() 함수 사용 4,5번 조건은 1번 코드를 작성..
해당 포스트는 R에서 행렬(matrix)을 리스트(list)에 저장한 후 특정 연산을 수행하는 방법에 대해 소개합니다. INTRO 행렬(matrix)은 R에서 많이 사용되는 데이터 프레임(Data frame)과 유사하여 데이터 조작이 낯설지 않으실 겁니다. 하지만, 리스트(list)에 저장된 행렬(matrix)을 조작하려는 경우에는 다른 코드 사용법을 알아야 하며 아래에서는 그 방법에 대해 설명합니다. 질문 풀이 1. 데이터 생성 문제에서 주어진 연산이 가능하도록 데이터를 생성하겠습니다. 먼저, mat라는 행렬(matrix) 데이터를 생성한 후, 리스트(list) 타입으로 변환하여 info라는 변수에 저장합니다. # info라는 list에 mat 이라는 matrix 생성 # 원소는 c() 함수에 할당된 ..
해당 포스트는 한경비즈니스에서 포스팅한 자료를 보고 개인적으로 정리한 내용입니다. 뭐 새로운거 없을까? 모든 사람이 가지고 있는 '숙제' 같은 질문이다. 최고경영자(CEO)나 리더라면 '조직의 새로운 성장 동력'을 찾기 위해 새로운 아이템을 끊임없이 고민핟. 편집을 통해 만든 창조물 '아이폰' 스티브 잡스가 한 것은 각각의 기기에서 따로따로 쓰이고 있던 기술을 아이폰이라는 하나의 물건에 잘 담아낸 것이다. 기존에 있던 것을 엮에 새롭게 재구성하는 '편집'이 창조를 이끌어 낼 수 있다. "스티브 잡스의 천재성은 기존 제품을 개량해 새로운 것을 만들어 내는 편집 능력"이다. - 언론인 출신 베스트셀러 작가 '말콤 글래드웰' 첫째 연결 &..
해당 포스트는 포츈코리아(FORTUNE KOREA)의 '다시 지원하고 싶은 회사 vs 붙어도 안 갈 회사'에 대한 기사를 읽고 개인적인 의견을 정리한 글입니다. 기업이 가장 신경써야 할 채용 절차 중 하나가 '면접'이다. 지원자 역시 면접을 통해 출근 여부를 가늠하기 때문이다. 박보희 컴퍼니타이임즈 기자 면접 과정은 면접관, 지원자 모두에게 어려운 자리입니다. 지원자는 짧은 시간동안 자신의 강점, 장점을 어필해야하고, 면접관은 다양한 질문을 통해 면접자의 숨은 특성까지 파악하고 평가해야 합니다. 과거 면접관들의 일방적인 평가로 진행되던 과거와는 달리, 최근에는 면접관과 면접자가 서로를 평가하는 형태로 변화하고 있으며, 이 때, 주고 받는 대화 외에도 제스처, 태도, 눈빛 등 ..
이번 포스트는 한경BUSINESS 경영전략 트렌드 '조직 성과 높이려면 '하이브리드 워크에서의 협업과 소통 방법[임주영의 경영 전략]'를 읽고 정리한 글 입니다. 출처 : 하이브리드 워크에서의 협업과 소통 방법[임주영의 경영 전략] "공동의 이정표 만드는 것이 최우선…구성원들의 투명성 제고 위한 노력도 필요해" 구글의 최고 팀들이 가지고 있는 5가지 요소 상호 의존성(dependability) : 구성원들이 각자 맡은 일을 수행하고 공동의 높은 기준을 충족시킨다. 체계와 명확성(structure and clarity) : 각자의 역할이 명확하고 팀의 ‘운영 원칙’이 있다. 의미(meaning) : 자신의 업무에 개인적인 의미를 느낀다. 영향(impact) : 자신의 업무가 중요하며 ..
이 포스트는 한빛미디어에서 출간한 '트랜스포머를 활용한 자연어 처리'을 읽고 작성한 서평입니다. INTRO 자연어 처리(NLP) 관련 업무를 하시는 분들에게는 버트(BERT)와 트랜스포머(Transformer)는 새로운 세대의 출현이라고 할만큼 중요하고 필수적인 지식이 되었습니다. 특히, 최근 트랜스포머(Transformer)에서 파생되는 다양한 모델들은 문서 요약, 생성, 분류 등 다양한 곳에 활용되고 있는데, 이러한 모델들을 손쉽게 활용할 수 있도록 활용성을 높여주는 집단이 바로 이 책의 저자들이 속한 허깅페이스(Hugging Face) 입니다. 세계적으로 인정받는 허깅페이스(Hugging Face)의 개발팀이 집필하고, IT분야 집필/번역 전문가이신 박해선님이 작업해주신 멋진 책이라 ..
이 포스트는 한빛미디어에서 출간한 '데이터 과학을 위한 파이썬과 R'을 읽고 작성한 서평입니다. INTRO 데이터 분석을 시작하시는 분들을 보면 Python과 R 선택에 있어 항상 고민에 빠지게 됩니다. 전공 또는 목적에 따라 대부분 선택되긴 하지만 그럼에도 통계 분석이 좀 더 중요할 땐 R, 딥러닝과 같은 low-level의 프로그래밍이 필요한 경우엔 Python을 병행해서 사용하는 분들이 많습니다. 저 또한 R 유저로 시작하였지만, 동료들과의 협업 및 딥러닝 목적으로는 Python을 병행하여 사용하고 있기에 해당 도서에 호기심이 생겼었습니다. 아래에서는 해당 도서 소개 및 개인적으로 책을 읽고 느낀 내용을 작성하였습니다. 필요하신 분들에게 도움이 되었으면 좋겠습니다. 책 소개 이중 언어..