이 포스트는 한빛미디어에서 출간한 '트랜스포머를 활용한 자연어 처리'을 읽고 작성한 서평입니다. INTRO 자연어 처리(NLP) 관련 업무를 하시는 분들에게는 버트(BERT)와 트랜스포머(Transformer)는 새로운 세대의 출현이라고 할만큼 중요하고 필수적인 지식이 되었습니다. 특히, 최근 트랜스포머(Transformer)에서 파생되는 다양한 모델들은 문서 요약, 생성, 분류 등 다양한 곳에 활용되고 있는데, 이러한 모델들을 손쉽게 활용할 수 있도록 활용성을 높여주는 집단이 바로 이 책의 저자들이 속한 허깅페이스(Hugging Face) 입니다. 세계적으로 인정받는 허깅페이스(Hugging Face)의 개발팀이 집필하고, IT분야 집필/번역 전문가이신 박해선님이 작업해주신 멋진 책이라 ..
이 포스트는 한빛미디어에서 출간한 '데이터 과학을 위한 파이썬과 R'을 읽고 작성한 서평입니다. INTRO 데이터 분석을 시작하시는 분들을 보면 Python과 R 선택에 있어 항상 고민에 빠지게 됩니다. 전공 또는 목적에 따라 대부분 선택되긴 하지만 그럼에도 통계 분석이 좀 더 중요할 땐 R, 딥러닝과 같은 low-level의 프로그래밍이 필요한 경우엔 Python을 병행해서 사용하는 분들이 많습니다. 저 또한 R 유저로 시작하였지만, 동료들과의 협업 및 딥러닝 목적으로는 Python을 병행하여 사용하고 있기에 해당 도서에 호기심이 생겼었습니다. 아래에서는 해당 도서 소개 및 개인적으로 책을 읽고 느낀 내용을 작성하였습니다. 필요하신 분들에게 도움이 되었으면 좋겠습니다. 책 소개 이중 언어..
해당 포스트는 골든래빗 출판사로부터 책을 제공받아 작성했습니다. 책을 읽고 ▶ 주관적인 평점 : 4.5점 / 5.0점 파이토치(Pytorch)는 딥러닝 프레임워크 중 가장 많이 사용되는 편이며, 가장 파이썬(Python) 구조와 유사하여 직관적이라는 장점이 있습니다. 저 또한 텐서플로우(Tensorflow)보다는 파이토치(Pytorch)를 많이 사용하고 있으며, 개발 환경 제약이 있거나 코드 최적화가 필요한 상황이 아닌 경우에는 지금까지 전혀 부족함이 없었습니다. 해당 도서에서는 이론 설명과 예제 실습을 위주로 실제 손에 익혀가며 학습하는 구조로 설명하고 있습니다. 간단한 코드들을 직접 구현해 보며 딥러닝 전반적인 메카니즘 및 코드 작성 패턴을 이해하고 싶으신 분들에게 추천드립니다. 또한, 딥러닝을 잘 ..
이 포스트는 한빛미디어에서 출간한 'XGBoost와 사이킷런을 활용한 그레이디언트 부스팅'을 읽고 작성한 서평입니다. INTRO 데이터 분석 경진 대회(Kaggle, Dacon 등)에서 초반에 리더 보드 상위를 장악하는 것은 항상 XGBoost, scikit-learn을 활용한 모델입니다. 두 라이브러리 활용한다면, 타 모델과 비교/검증을 통해 빠르고 효율적으로 모델을 구축할 수 있으며, 간단한 작업으로도 다양한 튜닝을 시도할 수 있습니다. 해당 책은 입문 단계를 넘어 보다 깊은 분석을 원하는 분들에게 도움이 되는 책이며, 도서 구입에 고민이 되는 분들을 위해 아래 후기를 작성해 보았습니다. 책 소개 캐글 우승자들의 머신러닝 우승 비법이자 현존하는 가장 우월한 머신러닝 모델 XGBoost ..
해당 포스트는 제이펍에서 출간한 '코딩 인터뷰를 위한 알고리즘 치트시트'를 읽고 작성한 서평입니다. INTRO 최근 코딩 테스트는 IT분야 취업에 기본 과정이 되었습니다. 그 중에서도 알고리즘(Algorithm)은 면접에서도 자주 언급되는 부분이기에 프로그래머로 커리어를 준비하시는 분들이라면 보다 깊은 이해와 사례를 경험해 보시는 것이 좋습니다. 해당 도서에서는 깃허브(Github)에서 10만 개 이상의 스타(Star)를 받은 다양한 알고리즘을 설명하며 반복적인 연습을 통해 이해를 높일 수 있도록 도와줍니다. 책 소개 리트코드LeetCode로 실습하며 코딩 인터뷰를 대비하는 알고리즘 문제 풀이 참고서 시험과 면접이 목적이라면 두꺼운 알고리즘 서적보다는 문제를 직접 풀어보는 것이 훨씬 도움이..
해당 포스트에서는 리텐션(Retention)의 뜻을 설명하고 실제 리텐션을 높인 사례을 소개합니다. 리텐션(Retention)? 한번 획득한 유저들이 서비스를 이탈하지 않고 계속 서비스를 이용하는 것 (출처) 시간이 지날수록 얼마나 많은 유저가 제품으로 다시 돌아오는지를 측정한 것 (출처) 리텐션(Retention) 사례 출처 : 토스가 유저의 리텐션을 높이는 법 1. 토스 - '브랜드 캐시백' 매주 새로운 브랜드 선택지를 10개 제공하고, 사용자는 이중 원하는 3곳을 선택해 쇼핑 후 일정 금액 캐시백 받음 사용자는 매주 업데이트되는 브랜드 선택지 10곳을 확인하기 위해 토스 앱에 최소 한 번 접속 브랜드 3곳을 선택한 후 서비스 결제를 진행하면 적립된 토스 포인트를 환급받기 위해 또 토스..
이 포스트는 한빛미디어에서 출간한 '(소문난 명강의) 김기현의 딥러닝 부트캠프 with 파이토치'을 읽고 작성한 서평입니다. INTRO 최근 딥러닝 도서는 셀 수 없이 많습니다. 다양한 도서들 중 해당 도서가 가지는 뚜렷한 특징은 다년 간의 패스트 캠퍼스 강의 경험이 녹아있는 실전에 가까운 딥러닝 학습 도서라는 점입니다. 개념, 수식, 실습의 반복으로 딥러닝의 다양한 내용을 설명하고 있으며, 초보자 분들에게 어려운 수식들도 쉽게 풀어 설명하고 있습니다. 도서 구입에 고민이 되는 분들을 위해 아래 후기를 작성하였으니 도움이 되었으면 좋겠습니다. 책 소개 딥러닝 기초 개념 + 수식 정리 + 코딩 실습 + 실무 환경 프로젝트 연습 이 책은 딥러닝의 기초 내용과 응용 지식을 체계적으로 전달하기 위..
해당 포스트는 대학 커뮤니티 게시글을 생성하는 AI 모델 UCK-GPT2를 소개합니다. INTRO 최근 AI기술은 실생활 다양한 곳에 적용되어 자연스럽게 활용되고 있습니다. 특히, 언어 관련 기술들은 가까이는 핸드폰의 시리, 빅스비에 적용되어 있고, 스마트 스피커에는 기가지니, 알렉사, 클로바, 카카오 등에 적용되어 사용되고 있습니다. 이러한 챗봇, AI 상담사 등의 서비스들은 기본적으로 고객의 질문을 이해하고, 준비된 답변 중 선택하여 출력하는 방식으로 처리가 되는데, 최근에는 준비된 답변이 아닌 질문에 맞게 언어를 생성하여 답변할 수 있는 기술이 공개 및 활용되고 있습니다. 아래 소개하는 UCK-GPT2는 언어 생성 모델 중 하나로, 대학 커뮤니티 글을 학습하여 언어를 생성이 가능한 한국어 언어 모델..
이 포스트는 한빛미디어에서 출간한 '혼자 공부하는 컴퓨터 구조+운영체제'을 읽고 작성한 서평입니다. INTRO 컴퓨터에 관심이 있으신 분이라면, 컴퓨터 구조 및 운영체제에 대한 자세한 내용은 몰라도 내 컴퓨터가 어느 정도 성능인지(CPU, RAM, HDD 등) 또는 내가 사용하고 있는 운영체제(OS)가 어떤거지(Windows, Linux, MacOS 등)에 대해서는 알고 계실겁니다. 이러한 정보들은 컴퓨터를 사용하는 분들에게는 기본으로 알고 있으면 좋은 정보들이며, 만약 IT 관련 업무를 하시는 분이라면 개인/협업을 위해 자세히 알아두는 것이 좋습니다. 해당 도서에서는 컴퓨터 구조 및 운영체제에 대해 알기쉽게 설명하고 있으며, '입문자 맞춤형 7단계 구성'을 통한 체계적인 설..
이 포스트는 제이펍에서 출간한 '쏙쏙 들어오는 함수형 코딩(Grokking Simplicity)'을 읽고 작성한 서평입니다. INTRO 혼자 공부를 하면서 가장 어려운 부분은 내가 작성한 코드의 객관적인 평가를 받는 부분입니다. 최근에는 개발자 커뮤니티나 github 같은 환경들을 이용해 일부 자신의 코드를 평가받고 개선하고 있으나, 내가 작성한 코드가 평가를 받기 위한 최소한의 자격은 갖췄는지 의구심은 쉽게 해결되지 않습니다. 해당 도서에서는 이런 분들을 위해 코드를 작성할 때 지켜야 하는 규칙들을 소개하고 있으며, 나아가 실제 프로그램 개발 및 협업을 위해 필요한 개념(분산 시스템, 추상화, 계층형 설계, 디자인 패턴 등)들을 자세히 설명하고 있습니다. 도서 소개 소프트웨어의 복잡성을 ..