학술연구·상업적 이용 모두 가능
이달 들어 자체 개발 인공지능(AI) 모델 4종을 연이어 내놓은 SK텔레콤이 시각·언어모델(VLM)과 거대언어모델(LLM) 학습을 위한 범용 문서 해석 기술(인코더)을 추가로 선보였다.

SKT는 29일 오픈소스 커뮤니티 허깅페이스에 시각·언어모델인 ‘A.X 4.0 VL 라이트(비전 랭귀지 라이트)’와 ‘A.X 인코더’를 공개했다. 두 모델은 학술 연구는 물론 상업적 이용도 가능하다.
‘A.X 4.0 VL 라이트’는 SKT의 AI 모델인 에이닷 엑스(A.X)를 기반으로 하는 중형급 시각·언어모델이다. 글자료뿐 아니라 표·그래프, 제조 도면 등 산업 현장에서 필요한 데이터를 이해하는 능력을 갖췄다. 이 모델은 한국어 시각 벤치마크에서 평균 79.4점을 기록해 중국 알리바바의 큐원 2.5-VL32B보다 우수한 성능을 보였다.
함께 공개한 ‘A.X 인코더’는 긴 문서를 빠르고 효율적으로 처리해 대규모 LLM 학습에 적합하다. 인코더란 자연어처리 기술에서 입력한 문장을 문맥으로 변환하고 이를 바탕으로 다양한 자연어처리 작업을 수행하도록 돕는 핵심 구성요소다. 이 인코더는 기존 모델들보다 최대 3배의 추론 속도와 2배의 학습 속도를 구현한다.
김태윤 SKT 파운데이션 모델 담당은 “독자적인 기술력 확보가 소버린 AI의 핵심인 만큼 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것”이라고 말했다.
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]