오픈AI, 구글, 메타와 어깨 나란히
310억 파라미터로 1조 모델과 경쟁
GPT-4.1 상회…“기업 효율성 극대화”
업스테이지가 개발한 차세대 거대언어모델(LLM) ‘솔라 프로 2’가 글로벌 인공지능(AI) 모델 성능 평가에서 국내 유일의 프런티어 모델로 선정됐다.
솔라 프로 2는 독립 LLM 성능 분석기관 ‘아티피셜 애널리시스’가 최근 발표한 ‘지능 지표(Intelligence Index)’ 기반 평가에서 프런티어 모델로 꼽혔다. 이 지표는 추론, 종합지식, 수학, 코딩 등 7개 대표 벤치마크로 글로벌 상위권 모델을 평가하는데, 높은 투명성과 객관성으로 업계 신뢰를 얻어 글로벌 빅테크 기업들이 인용하고 있다.

이번에 업스테이지는 △오픈AI △구글 △메타 등 AI 업계 선두주자들과 나란히 10대 프런티어 모델 개발사에 이름을 올렸다. 솔라 프로 2는 최상위 모델만 선별하는 아티피셜 애널리시스 플랫폼에 유일한 한국 모델로 등록됐는데, 국내 개발 LLM이 글로벌 프런티어급으로 꼽힌 것은 처음이다.
솔라 프로 2는 58점을 기록하며 △미스트랄 스몰(55) △GPT-4.1(53) △라마 4 매버릭(51) △GPT-4o(41)’ 등 빅테크 LLM을 제치고 더 높은 성능을 기록했다. 딥시크 V3(53)와 문샷 AI의 키미 K2(57.59) 등 중국 모델도 모두 추월하며 상위권에 안착했다.
주요 프런티어 모델 대부분은 1000억~2000억개 매개변수(파라미터)를 탑재한 대형 모델이며, 가장 높은 성능을 기록한 일론 머스크의 AI 스타트업 xAI의 ‘그록-4’는 1조7천억개에 달한다. 반면 솔라 프로 2는 단 310억 매개변수로 이같은 성과를 거두면서 소형 언어모델의 기술 경쟁력과 효율성을 입증했다.

특히 현재 기업 환경에서 가장 널리 쓰이는 범용 모델인 GPT-4.1은 대부분의 업무에서 충분한 성능을 제공하는 것으로 평가받지만, 솔라 프로 2는 이를 넘어 고난도 추론 능력에서 확실한 우위를 차지했다. 비용 대비 성능 평가에서도 클로드 4 소넷, 마지스트랄 스몰’ 등 주요 모델보다 효율적인 것으로 평가돼, 기업 입장에서 최소 도입 비용으로 최고의 성능을 구현할 수 있는 모델이라는 평가가 나온다.
머스크는 솔라 프로 2의 글로벌 프런티어 모델 선정 소식을 자신의 엑스(X·옛 트위터) 계정에 공유하면서 “그래도 xAI의 그록이 1등이다. 그리고 그록은 매우 빨리 나아지는 중”이라며 견제하고 나섰다.

업스테이지는 후속 모델로 1000억 파라미터 규모의 차세대 LLM을 개발할 계획이다. 향후 프런티어 인덱스 최상위권 진입도 기대하고 있다.
업스테이지 김성훈 대표는 “국내 기술로 개발한 파운데이션 모델 솔라 프로 2가 글로벌 최상위 모델들과 어깨를 나란히 할 수 있음을 입증해 기쁘다”며 “앞으로도 독자적인 기술력으로 자체 모델을 더욱 고도화하여 대한민국이 AI 3강을 넘어 글로벌 시장에서 기술 주도권을 차지할 수 있도록 기여하겠다”고 밝혔다.
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]