[도서리뷰] 한빛미디어 '파이토치로 배우는 자연어 처리'

이 포스트는 한빛미디어에서 출간한 '파이토치로 배우는 자연어 처리(Natural Language Processing with PyTorch'을 읽고 작성한 서평입니다.

▲ '파이토치로 배우는 자연어 처리' 표지

INTRO

본 도서에서는 자연어 처리 및 딥러닝 알고리즘 학습에 필요한 내용을 소개합니다. 파이토치(PyTorch)를 사용해 자연어 처리 과정에서 직면할 수 있는 문제와 다양한 텍스트를 표현하는 애플리케이션을 구축하는 방법을 소개하며, 딥러닝 및 자연어 처리 기초부터 시퀀스(Sequence) 모델링까지 이해를 돕고 있습니다.

주요 내용

  • 계산 그래프 및 지도 학습 이해하기
  • 신경망을 구축하는 기본적인 방법
  • 자연어 처리의 기본 개념 학습하기
  • 자연어 처리를 위한 피드-포워드 신경망
  • 임베딩을 사용해 단어, 문장, 문서 및 기타 기능 나타내기
  • 자연어 처리를 위한 시퀀스 데이터 모델링 - 초급, 중급, 고급
  • 시퀀스 예측 및 시퀀스-투-시퀀스 모델 확장
  • 카카오브레인에서 만든 자연어 처리 라이브러리 뽀로로(pororo) 살펴보기(한국어판 부록)

특징 1: NLP 기초부터 탄탄하게!

해당 도서는 자연어 처리(NLP)라는 관점에 집중하여 전반적인 내용을 소개하고 있습니다. 자연어 처리에 필요한 기초 개념, 필수 기술들, 신경망 개념 등을 설명한 후에 단어 임베딩에 대한 소개가 시작되며, 페이지로는 책의 절반이 막 지나는 지점입니다.

타 도서의 경우, 기초 개념 부분에 워드 임베딩을 설명하고 다양한 네트워크 및 모델을 소개하면서 활용 위주의 내용을 다뤘다면 해당 도서는 "기초부터 탄탄히 하자!" 라는 느낌의 책이라는 생각이 들었습니다. 자연어 처리에 관심을 갖고 시작하시는 분들에게는 이런 부분이 장점이 될 수 있을 것 같습니다.

▲ '단어와 타입 임베딩' 부분

▲ '시퀀스 투 시퀀스' 목차

특징 2: 매력적인 부록 뽀로로(PORORO)

일반적으로 번역 도서에서 다루는 기술은 번역과 출간을 거치며 이미 트렌드가 지난 기술이 되는 경우가 많습니다. (최근 기술 발전 속도를 보면 트렌드 전환 주기가 더 짧아질 것 같습니다.) 신간 책을 받아 기술을 학습하려는데 트렌드 지난 기술이라 아쉬운 경험이 있었는데, 이 책에서는 이런 아쉬운 부분을 부록에 담아 학습자들을 배려하고 있습니다.

부록에서 다루는 내용은 2020년 카카오 브레인에서 개발한 자연어 처리 라이브러리 뽀로로(pororo) 이며, 한국어 자연어 처리를 위한 다양한 기술들을 간단한 코드로 사용할 수 있게 지원합니다. 책에서는 라이브러리 내 함수들을 자세히 뜯어보진 않지만, Task별 사용법을 꼼꼼하게 정리하고 및 설명하고 있어 개인별 학습에는 충분한 내용을 소개합니다.

▲ Pororo를 활용한 한글 자연어 처리

▲ Pororo를 활용한 한글 감성 분석

총평

▶ 주관적인 평점 : 3.5점 / 5.0점

이번 리뷰는 기존에 읽었던 타 도서와 비교하며 읽다보니 좋은 점수를 주긴 어려웠습니다. OREILLY에서 발간하였기에 최소한의 증명이 된 책이라는 점, 내용이 탄탄하다는 점은 장점으로 볼 수 있으나, 최근 자연어 처리 관련 도서들이 많이 나왔고 해당 도서들과 비교했을때 다루는 범위나 기술 트렌드가 더 뛰어나다고 생각하긴 어려웠습니다.

부록에서 다루고 있는 카카오브레인 뽀로로(pororo) 는 기초를 공부하시는 분들에게는 "간단한 코드로 이런것들을 다 할 수 있네?" 라는 꿀팁이 될 수 있겠지만, 어느정도 이해가 있으신 분들에게는 Github에서 제공하는 정보에서 크게 벗어나지 않는다는 것을 알 수 있습니다.

개인적인 기대에 못미쳐 평점을 낮게 부여했으나 기초부터 공부하시는 분들에게는 좋은 책인것은 분명하니 자연어 처리 기초 학습 도서를 고민하시는 분이라면 포함하여 고민하셔도 좋겠습니다.

관련 링크

[1] 한빛출판네트워크(책 소개 페이지)
[2] 예제 코드 - Github
[3] PORORO: Platform Of neuRal mOdels for natuRal language prOcessing