카카오브레인, ‘RQ-트랜스포머’공개

입력 2022-04-19 17:04:00
카카오톡 공유하기
프린트
공유하기 닫기

‘사막에 있는 에펠탑’이라는 텍스트 조건에 의해 생성된 샘플 이미지. 사진제공|카카오브레인

카카오브레인이 지난해 12월 공개한 초거대 멀티모달 인공지능(AI) ‘민달리’(minDALL-E)의 업그레이드 버전인 이미지 생성 모델 ‘RQ-트랜스포머’를 오픈소스 커뮤니티 깃허브에 공개했다. 39억 개의 매개변수(파라미터)로 구성된 ‘RQ-트랜스포머’는 3000만 쌍의 텍스트-이미지를 학습했다. 민달리 대비 모델 크기는 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘렸다.

특히 민달리의 경우 미국의 오픈AI가 공개한 ‘달리’를 재현하는 것에 가까웠던 것에 비해 ‘RQ-트랜스포머’의 경우 카카오브레인만의 독자적인 기술로 개발됐다.

김명근 기자 dionys@donga.com




오늘의 핫이슈

뉴스스탠드