SK텔레콤이 최신 그래픽처리장치(GPU) 기반 ‘GPUaaS’(서비스형GPU)를 출시했다. GPUaaS는 대규모 모델 학습과 추론을 위해 설계된 GPU 클라우드 인프라를 제공하는 서비스다. 이번에 선보인 GPUaaS는 1000장이 넘는 엔비디아의 최신 인공지능(AI)칩 ‘블랙웰 B200’을 단일 클러스터로 구성해 제공하는 국내 최대 규모 GPUaaS다. 지난해 12월 출시한 ‘H100’ 기반 GPUaaS보다 발전된 형태로 국내 AI산업의 인프라 확충에 기여할 것으로 기대된다.

●‘B200’ 구축
SK텔레콤은 가산 AI 데이터센터(AI DC) 내에 최신 B200 GPU 클러스터를 조성했다.  클러스터 이름은 ‘해인’이다. 팔만대장경이 보관된 ‘해인사’에서 모티브를 가져왔다. 이번 클러스터가 디지털 팔만대장경을 품은 ‘K-소버린 AI인프라’가 되겠다는 의미를 담았다. 특히, SK텔레콤의 해인 클러스터의 GPUaaS는 과학기술정보통신부의 ‘AI-컴퓨팅 자원 활용 기반 강화(GPU 임차 지원) 사업’에 선정되며, 국가 AI 파운데이션 모델 개발에 활용될 예정이다. GPU 임차 지원 사업은 국내 AI 산업의 글로벌 경쟁력 확보와 국가 AI 생태계 고도화를 위해 마련됐다. SK텔레콤은 이번 사업을 통해 가산 AI DC를 국내 AI 산업 발전의 중추적 기반 인프라로 발전시켜 나갈 계획이다.

●글로벌 기업과 협력
SK텔레콤은 이번 GPUaaS 출시를 위해 미국 AI DC 통합 솔루션 회사 펭귄 솔루션스와 전략적 협력을 추진해 왔다. 펭귄 솔루션스는 엔비디아 인증 10대 구축 파트너다. 25년 이상 HPC(고성능 컴퓨팅) 솔루션 설계와 제공 및 관리에 주력하며 글로벌 시장에서 입지를 다져왔다. SK텔레콤은 2024년 7월 펭귄 솔루션스와 2억 달러 규모 투자 계획을 체결하고, 시너지 TF를 구성해 구체적 상호 협력 방안을 논의하는 등 GPUaaS 서비스를 준비해 왔다.

또 전략적 파트너사인 글로벌 AI 서버 제조사 슈퍼마이크로와의 협력을 통해 단기간 내 GPU 서버를 빠르게 수급해 적기 제공할 수 있었다. SK텔레콤의 독자 기술력도 활용됐다. 자체 가상화 솔루션인 ‘페타서스 AI 클라우드’를 활용해 GPU 클러스터를 고객 수요에 맞춰 즉시 분할하고 재구성해 가동률을 극대화했다. 

SK텔레콤은 앞으로도 GPUaaS 사업을 지속 확장해 국내 AI 사업이 세계 무대에서 경쟁력을 가질 수 있도록 인프라 차원의 지원을 강화할 계획이다.

김명국 SK텔레콤 GPUaaS사업본부장은 “최신 GPU인 B200을 활용해 국내 최대 규모로 준비한 해인 클러스터의 GPUaaS는 고객 및 국가의 AI 경쟁력을 높이는 계기가 될 것이다”며 “AI 인프라 사업자로서 국가 AI 고속도로 구축에 힘을 쏟겠다”고 말했다.



김명근 기자 dionys@donga.com