대규모언어모델(LLM) 활용 방식 및 주요 이슈 분석
LLM 활용 방식 및 주요 이슈 분석 IT & Future Strategy 제5호(2023. 8. 11.) 1. 인공지능 대형화 및 혁신 서비스 탄생 ☐ GPT‐3 이후 촉발된 인공지능의 대형화 경쟁 2012년을 기점으로 10년 동안 인공지능은 급격히 발전하며, 전 세계적으로 인공지능은 국가‧산업 경쟁력의 핵심으로 인식하고 있습니다. 2012년 시각 인공지능 분야 올림픽인 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 딥러닝의 가능성을 전 세계 인공지능 연구계에 전파하였습니다. 연구계에서 주목받던 인공지능(딥러닝) 기술이 이세돌과의 알파고 대국(2016년) 이후 국가‧산업 전반에서 중요성 인지하게 되었습니다. 이후 국가별 정책 지원, 기업들의 인공지능에 대한 투자가 경쟁적으로 진행되며, 인공지능의 성능이 지속적으로 향상되었습니다. 2020년 오픈AI는 GPT 시리즈의 세 번째 언어모델을 공개하였으며, 당해 최고 주목받는 연구성과로 전 세계인의 이목을 받았습니다. 오픈AI는 처음에는 인류를 위한 AI 개발을 목표로 하는 비영리단체로 GPT 언어모델 시리즈 등 창의적인 연구 성과물을 발표하였습니다. GPT‐3는 이전에 공개된 MS의 언어모델보다 사이즈가 10배 이상 큰 1,750억개의 매개변수를 가진 초거대 언어모델로, 글로벌 빅테크 기업은 앞다투어 초대규모 인공지능을 개발하기 시작하며 본격적인 대형화 경쟁을 촉발하였습니다. ☐ LLM은 범용 인공지능(AGI)의 가능성을 시사 GPT‐3 이전은 목표 과업별로 모델을 각각 개발했으나, GPT‐3 이후부터 범용성 높은 거대 모델 개발로 트렌드 전환되었습니다. 기존에는 목표 과업(번역, 요약, 질의응답)에 해당하는 모델을 구축하기 위해 대량의 데이터로 모델을 각각 개발하였습니다. 하지만 GPT‐3 등 LLM은 목표 과업을 위해 모델 미세조정 또는 퓨샷...