LLM 핵심 OCR 기술력 입증
네이버클라우드가 글로벌 문자인식 기술 경진대회에서 1위를 차지하며 광학문자인식(OCR) 분야에서 경쟁력을 입증했다.
9일 정보통신기술(ICT) 업계에 따르면 네이버클라우드는 지난달 16∼21일 중국에서 열린 국제패턴인식학회(IAPR) 학술 콘퍼런스 ‘ICDAR 2025’에서 진행한 문자인식 기술 경진대회에서 1위를 수상했다. 이 행사는 IAPR이 1991년부터 주관하는 문서 분석과 인식 학술 콘퍼런스로 세계적인 국제 경진대회다. 네이버와 네이버클라우드는 2018년, 2019년, 2022년에 이어 올해 네 번째로 ICDAR에서 1위를 기록했다.
네이버클라우드는 ‘역사 지도 텍스트 판독’ 영역에서 1위를 차지했다. 이 부문은 과거에 만들어진 지도 이미지 속에 복잡한 레이아웃으로 구성된 문자를 검출하는 고난도 과제로 구성된다. 옛 지도엔 지역명이 두 줄 이상 나뉘어 적히거나 직선이 아닌 곡선 형태로 표기된 경우, 경계선과 단어가 중첩된 사례 등이 발견된다. 네이버클라우드는 문서 이미지 내 텍스트와 좌표를 동시에 추출하는 ‘엔드 투 엔드’ 방식의 모델로 문자인식 기술을 인정받았다.
OCR 기술은 ‘거대언어모델’(LLM) 성능을 높이는 데 핵심 역할을 한다. 이미지 형태의 한국수학능력시험이나 검정고시 문제를 인공지능(AI)이 푸는 과정에서 OCR 능력이 부족한 모델은 지문 자체를 잘못 읽거나 일부를 놓쳐 후속 추론이 틀어지는 경우가 잦다고 한다.
Copyright ⓒ 세계일보. 무단 전재 및 재배포 금지