반크, ‘한국 특화 생성형 AI 평가지표’ 도입 정책 제안

사진제공｜반크

ChatGPT 등 글로벌 AI의 한국 역사 및 데이터 주권 확보
글로벌 AI 기업에 한국 정보에 대한 실질적 개선 요구

사이버 외교사절단 반크(단장 박기태)는 최근 ChatGPT, 퍼플렉시티(Perplexity), 그록(Grok) 등 글로벌 생성형 AI 서비스 확산에 따라 발생하는 한국 관련 정보 오류와 왜곡 문제를 바로잡기 위해, ‘한국 특화 생성형 AI 성능 평가지표’ 도입을 한국 정부에 제안하고, 반크 또한 민간차원에서 본격적인 감시 체계 구축에 나선다고 밝혔다.

최근 생성형 AI는 전 세계적으로 영향력을 확대하고 있으나, 한국의 역사와 문화를 설명하는 과정에서 핵심 맥락을 누락하거나 부정확한 정보를 제공하는 사례가 반복적으로 확인되고 있다.

반크의 모니터링 결과, 유네스코 세계유산인 ‘수원화성’에 대한 AI 설명에서 일제강점기와 한국전쟁 시기의 훼손 역사, 『화성성역의궤』를 바탕으로 한 복원의 역사적·기술사적 의의가 누락된 사례가 확인됐다. 이 밖에도 독립운동사와 현대사가 특정 관점에 치우쳐 서술되거나, 정부의 최신 법령과 제도가 반영되지 않은 채 과거의 정보가 제공되는 문제도 나타나고 있다.

반크는 이러한 문제가 한국의 문화적 정체성과 공공 정보 신뢰를 훼손할 수 있는 구조적 문제라고 보고 있다. 기존 글로벌 AI 평가 기준이 언어 처리 능력 중심으로 설계돼 있어, 개별 국가의 역사·문화·행정 맥락을 충분히 반영하지 못한다는 점도 한계로 지적했다.

이에 반크는 공공이 기준을 설정하고 민관이 협력해 운영하는 ‘한국 특화 생성형 AI 평가지표’를 제안했다. 해당 지표는 ▲사실 정확성 ▲맥락 충실성 ▲데이터 활용도 ▲최신성 ▲편향성·해악성 등 5개 영역으로 구성되며, 한국의 공공성과 역사적 특수성을 종합적으로 평가하도록 설계됐다.

반크는 이 기준을 바탕으로 평가 결과를 공개하고, 분기별·연간 추가 질문을 통해 지속적인 모니터링 체계를 운영할 계획이다. 또한 평가 결과를 공개하고, 개선이 필요한 항목은 해당 AI 기업에 직접 전달해 시정을 요구할 방침이다.

반크 박기태 단장은 “이번 반크의 정책 제안은 데이터 주권과 문화 다양성 존중을 통해 생성형 AI 디지털 제국주의적 역사 왜곡과 디지털 식민지를 방지하기 위함이다. 해외 유명 생성형 AI의 편향된 국가 정보 데이터로 인한 문화적 종속을 경계하고, 고유한 역사와 가치를 지키며 인류의 다양한 문화가 공존하는 인공지능 생태계를 지향해야 한다” 고 강조했다. 이어 “앞으로 반크는 거대 기술 패권국의 데이터에 종속되지 않고 우리 고유의 문화와 정체성을 담은 ‘소버린 AI’를 추구하며, 나아가 제3세계의 다양한 문화적 가치도 훼손되지 않도록 보호하기 위해 글로벌 소버린 AI에도 앞장설 것이다”라고 말했다.

권소영 반크 국가정책플랫폼 담당 연구원은 “이번 평가지표 도입은 글로벌 AI 기업에 실질적인 개선을 요구할 수 있는 기준이 될 것”이라고 밝혔다. 이어 “평가 결과를 공개하고, 개선이 필요한 항목을 기업에 직접 전달하는 구조를 통해 AI 서비스의 응답 품질을 지속해서 점검할 수 있다”며, “이는 국민이 보다 정확한 공공 정보를 접할 수 있도록 하는 동시에, 디지털 시대의 데이터 주권을 강화하는 기반이 될 것”이라고 말했다.

이세연 반크 청년연구원은 “생성형 AI는 정답률이 높아질수록 추측에 기반한 내용을 사실처럼 제시하는 경향이 나타나고 있다”며 “이러한 특성은 공공 행정과 역사 정보 분야에서 특히 큰 위험으로 작용한다”고 지적했다. 이어 “신뢰성과 공정성을 확보하기 위해서는 공공이 검증한 기준에 따른 체계적인 평가가 필요하다”고 강조했다.

백시은 반크 청년연구원은 “이미 국내외에서는 편향성, 감성 평가 등 다양한 영역에서 AI를 어떻게 평가하고 통제할 것인가에 대한 지표 개발 논의가 진행되고 있다”고 말했다. 이어 “우리나라에서도 정책·행정·정보 탐색 전반에서 AI 활용이 빠르게 확산하고 있는 만큼, 이러한 흐름 속에서 한국의 상황에 맞는 기준을 논의할 시점”이라고 강조했다.

김예래 반크 청년연구원은 “생성형 AI가 한국의 역사를 잘못 설명하는 문제는 단순한 오류가 아니라, 공공 정보의 신뢰 자체를 흔드는 사안”이라고 말했다. 이어 “이번 한국 특화 생성형 AI 평가지표는 그동안 지적에 그쳤던 AI 오류를 실제로 개선하도록 요구할 수 있는 기준을 처음으로 제시했다는 점에서 의미가 크다”고 밝혔다. 그러면서 “공공이 기준을 세우고 시민이 참여해 검증하는 구조는 데이터 주권을 지키기 위한 현실적인 대응 방식”이라고 덧붙였다.

한편 반크는 이번에 제안한 한국형 생성형 AI 평가지표를 향후 각국이 자국의 역사와 문화를 보호하는 데 활용할 수 있는 ‘글로벌 표준 AI 평가 모델’로 확장해 나간다는 비전도 함께 제시했다.

이수진 기자 sujinl22@donga.com

반크, ‘한국 특화 생성형 AI 평가지표’ 도입 정책 제안

스타★들의 SNS 소식

댓글 0