해당 포스트에서는 MSBuild2020에서 OpenAI가 공개한 코드 생성 모델을 설명합니다.
OpenAI가 MSBuild2020(5/19~5/20) 에서 GPT*모델을 활용한 코드 생성 데모를 선보였습니다.
- GPT*(Generative Pre-Training) : OpenAI에서 공개한 N-gram 기반 언어 모델로 앞단어들이 주어지면 다음 단어를 예측하는 언어 모델
- 작년 GPT 모델 공개 이후, 뛰어난 성능으로 인해 가짜 뉴스 등 악용 사례에 대한 사회적 이슈가 있었습니다. (참고)
자동 완성이나 추천 보다는 앞단의 문맥을 이해(사용자 변수 고려 등)하여 코드를 생성하는 방식으로 보이며, 데모에서 보여지는 내용으로는 생각보다 완성도가 꽤 높은편으로 보입니다.
3줄 요약
- OpenAI에서 GPT 모델 기반의 Code Generation Demo 발표 (Github의 약 1천만건 오픈소스 학습)
- 함수 설명(Description), 함수명(Function Name) 기반 코드 생성
- 코드 생성 시, 바로 앞에서 정의한 변수 활용 (문맥 이해)
Case1 : 함수 설명(description) -> 코드 생성(노란색 부분)
Case2 : 함수 정의(define funcion) -> description 및 code 생성(노란색 부분)
출처
[1] The future of tech, with Kevin Scott and guests // Microsoft Build
[2] 노컷뉴스 : 인공지능이 진짜같은 '가짜뉴스'를 만들었다