OpenAI, GPT 활용한 코드 생성 데모 공개(@MSBuild2020)

해당 포스트에서는 MSBuild2020에서 OpenAI가 공개한 코드 생성 모델을 설명합니다.


OpenAI가 MSBuild2020(5/19~5/20) 에서 GPT*모델을 활용한 코드 생성 데모를 선보였습니다.
  • GPT*(Generative Pre-Training) : OpenAI에서 공개한 N-gram 기반 언어 모델로 앞단어들이 주어지면 다음 단어를 예측하는 언어 모델
  • 작년 GPT 모델 공개 이후, 뛰어난 성능으로 인해 가짜 뉴스 등 악용 사례에 대한 사회적 이슈가 있었습니다. (참고)

자동 완성이나 추천 보다는 앞단의 문맥을 이해(사용자 변수 고려 등)하여 코드를 생성하는 방식으로 보이며, 데모에서 보여지는 내용으로는 생각보다 완성도가 꽤 높은편으로 보입니다.

3줄 요약

  1. OpenAI에서 GPT 모델 기반의 Code Generation Demo 발표 (Github의 약 1천만건 오픈소스 학습)
  2. 함수 설명(Description), 함수명(Function Name) 기반 코드 생성
  3. 코드 생성 시, 바로 앞에서 정의한 변수 활용 (문맥 이해)

Case1 : 함수 설명(description) -> 코드 생성(노란색 부분)

Case2 : 함수 정의(define funcion) -> description 및 code 생성(노란색 부분)

출처

[1] The future of tech, with Kevin Scott and guests // Microsoft Build
[2] 노컷뉴스 : 인공지능이 진짜같은 '가짜뉴스'를 만들었다