네이버는 25일 온라인으로 열린 ‘네이버 AI 나우’ 컨퍼런스에서 ‘하이퍼클로바’를 공개했다. 국내 기업이 자체 개발한 첫 초거대 AI다. 초거대 AI는 종합적으로 사고, 학습, 판단, 행동하는 인간의 뇌 구조를 닮은 AI다.
사람과 자연스럽게 교감하고 전문가처럼 문제를 해결하는 등 다방면에서 활용이 가능하다. 이 때문에 구글과 아마존, 마이크로소프트(MS), 페이스북 등 글로벌 테크 기업은 물론 네이버 외에 LG전자, SK텔레콤, KT, 카카오 등 국내 기업들도 개발을 적극 추진하고 있다. 네이버는 하이퍼클로바로 국내 퍼스트무버를 넘어 글로벌 기술 리더로 발돋움하겠다는 계획이다.
GPT-3보다 많은 2040억 파리미터
하이퍼클로바는 일론 머스크 등이 설립한 미국 오픈AI가 개발한 GPT-3(1750억 개)를 뛰어넘는 2040억 개의 파라미터(매개변수) 규모로 개발됐다. 파라미터 수가 높을수록 더 많은 문제를 해결할 수 있다.
하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 현존 최고의 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터 대부분을 차지하는 GPT-3와 달리, 한국어 비중이 97%에 달한다. 또 해결하고자 하는 문제별로 데이터를 확보하고 정제해 개발한 기존 AI와 달리 방대한 데이터 학습으로 다양한 문제에 적용할 수 있다.
네이버는 하이퍼클로바 기술을 네이버의 각종 서비스에 적용할 예정이다. 이미 지난 6일 검색 서비스에 적용했다. 중소사업자(SME), 크리에이터, 스타트업 등에도 지원할 계획이다. 상품 판매 마케팅 문구를 자동으로 작성해주거나, 공부할 때 질문하면 자연스럽게 답변해주는 식이다. 네이버는 사업 및 연구 협력을 통해 다양한 방식의 기술 제공을 계획하고 있다.
카이스트와도 연구센터 설립
네이버는 하이퍼클로바 개발을 위해 지난해 10월 국내 기업 최초로 700 페타플롭(PF·1초당 1000조 번의 연산) 성능을 갖춘 슈퍼컴퓨터를 도입했다. 국내 최대 인터넷 플랫폼을 운영하며 쌓은 대규모 데이터 처리 능력도 주요 경쟁력이다. 네이버는 5600억 개 토큰(학습하는 단어·문장 단위)의 한국어 대용량 데이터를 구축했다.
연구 개발 역량 또한 하이퍼클로바를 자체 개발할 수 있었던 원동력이 됐다. 네이버는 지난해 글로벌 톱 AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표했다. 네이버는 또 서울대에 이어 카이스트 AI 대학원과도 연구센터를 설립하기로 했다. 네이버는 앞으로 하이퍼클로바를 한국어 외 다른 언어로 확장하고, 언어 뿐 아니라 영상이나 이미지 등도 이해하는 ‘멀티모달 AI’로 발전시켜나갈 계획이다.
정석근 네이버 클로바 CIC 대표는 “더 짧은 시간과 더 적은 리소스를 사용해 이전에 우리가 상상만 했던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다”고 말했다.
김명근 기자 dionys@donga.com 기자의 다른기사 더보기