카카오 “이미지 이해해 답변” MLLM ‘허니비’ 첫 선

입력 2024-01-22 10:00:00
카카오톡 공유하기
프린트
공유하기 닫기

카카오브레인이 개발한 멀티모달 언어모델 ‘허니비’.사진제공|카카오브레인

카카오, ‘AI 최고위 전략대화’서 새 AI 공개

MLLM 발전 위해 소스코드 공개
향후 교육·학습도구로 사용 기대
정신아 내정자 “AI, 기업간 협업 중요”
위기에 휩싸인 카카오가 새로운 인공지능(AI) 기술을 공개하며 분위기 반전에 나선다. 카카오는 19일 서울 여의도 전경련 회관에서 열린 ‘제5차 AI 최고위 전략대화’에서 멀티모달 언어모델(MLLM) ‘허니비’를 공개했다. AI 최고위 전략대화는 국가 AI 경쟁력 강화를 위해 민관이 함께 정책방향과 협력방안을 논의하는 협의체다. 이날 새 AI 기술을 직접 소개한 정신아 카카오 대표 내정자는 “AI는 기업 간 협업과 생태계가 중요하다”고 말했다.


●소스코드 공개

카카오는 카카오브레인이 개발한 허니비를 오픈소스 플랫폼 ‘깃허브’에 공개했다. 허니비는 이미지와 대규모 언어모델을 연결할 수 있는 MLLM이다. 현재 MLLM은 그 수가 적고, 학습 방법 역시 공개되지 않아 개발이 어려운 상황이다. 카카오브레인은 MLLM의 발전에 기여하기 위해 허니비의 소스코드를 공개하기로 결정했다고 밝혔다.

MLLM은 이미지와 명령어를 입력하면 텍스트로 답변하는 모델이다. 텍스트로만 입·출력하는 대규모 언어모델(LLM)에서 한 단계 더 확장된 형태로 볼 수 있다. 이미지와 텍스트를 모두 입력할 수 있어 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있다. ‘농구 경기 중인 두 명의 선수’ 이미지와 함께 ‘왼쪽 선수는 몇 번 우승했나요?’라는 질문을 입력하면, 입력된 이미지 내용과 질문을 종합적으로 이해하고 답변을 생성해내는 식이다.

카카오브레인은 이미지를 입력하고 텍스트로 질문하면 답변 생성 및 사용자와의 상호작용이 가능하다는 점에서 허니비가 향후 효과적인 교육 및 학습 보조 도구로 사용될 것이라 기대하고 있다.

정신아 카카오 대표 내정자. 사진제공|카카오



●“기업 간 협업 중요”

카카오는 이번 허니비 공개를 시작으로 AI 사업에 더욱 속도를 낼 것으로 보인다. 정 내정자는 “파운데이션 모델의 경우 내부에서 ‘코GPT’를 개발 중이고, 지난해 이미지 생성 모델인 ‘칼로’를 출시하기도 했다”며 “오늘은 더 나아가 MLLM을 공개했다. 조만간 쓸 수 있을 것으로 생각한다”고 말했다. 그는 또 “모바일 시대엔 기업들이 각자 열심히 개발하면 승자가 나왔지만, AI는 기업 간 협업과 생태계 발현이 중요하다”며 “정부도 함께 정책을 마련해주시면 좋겠다”고 했다.

한편, 이날 AI 최고위 전략대화는 AI 일상화가 곧 생존 전략인 시대에 전력을 다하지 않으면 도태될 것이란 범정부 차원의 공감대를 바탕으로 열렸다. 초거대 AI기업뿐 아니라 뷰티, 가전 등 다양한 분야를 대표하는 기업들과 AI 정책방향을 모색했다. 과학기술정보통신부는 이날 논의를 바탕으로 ▲AI플랫폼 확산 및 생태계 조성 ▲온디바이스 AI 확산 ▲전통산업의 AI 융합 활성화 ▲AI 기업 양성 및 해외진출 지원 확대 등을 추진해 나갈 계획이다.

김명근 스포츠동아 기자 dionys@donga.com 기자의 다른기사 더보기




오늘의 핫이슈

뉴스스탠드