![](https://dimg.donga.com/wps/SPORTS/IMAGE/2023/02/01/117673218.11.jpg)
제로샷 이미지 캡셔닝은 AI가 마치 사람의 시각 인지 능력처럼 처음 본 사물이나, 동물, 풍경 등이 포함된 이미지를 봤을 때나 일러스트레이션, 그래픽 등 표현 방식이 다른 이미지를 봤을 때 학습 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술이다.
이 기술이 고도화되면 이미지 인식 AI 기술의 정확성이 향상되고 사람들의 실생활에 직접적으로 도움을 줄 수 있는 기술 개발로 이어질 수 있다. LG는 사람의 시각 인지 능력에 가까이 다가서는 제로샷 이미지 캡셔닝이 이미지를 텍스트로 표현하고, 텍스트를 이미지로 시각화할 수 있는 초거대 멀티모달 AI인 ‘엑사원’의 기술 개발 생태계에 크게 기여할 것으로 기대하고 있다.
김명근 기자 dionys@donga.com 기자의 다른기사 더보기