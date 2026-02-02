한국정보인증이 과학기술정보통신부와 정보통신기획평가원(IITP)가 지원하는 정보보호핵심원천기술개발사업의 ‘인공지능 기술 활용 디지털 증거 분석 기법 개발’ 과제에 참여해 고품질의 인공지능 학습용 데이터세트를 구축하고, ‘키워드 기반 데이터 수집 및 데이터 라벨링 프로그램’을 개발했다고 밝혔다.

한국정보인증은 이번 과제 수행을 통해 디지털 성범죄 관련 인공지능(AI) 모델 개발에 즉시 활용 가능한 고품질의 학습데이터 세트 구축을 완료했다. 특히 구축된 데이터의 신뢰성 확보를 위해 실시한 자체 검증에서 데이터의 구조 및 형식이 규격에 맞는지 검증하는 ‘구문 정확성’과 라벨링 내용이 원문 의미와 정확히 일치하는지 확인하는 ‘의미 정확성’이 각각 초기 정량지표로 설정하였던 90%이상을 달성하며 데이터의 정밀함을 입증했다.

또한, ‘키워드 기반 데이터 수집 및 데이터 라벨링 프로그램’ 개발도 완료했다. 해당 프로그램은 얼굴, 이름 등과 같은 민감정보 및 개인정보를 비식별화 처리할 수 있는 기능이 적용되어 있어 의료, 헬스케어 분야의 AI 학습데이터 구축 시 활용도가 높다. 특히 키워드, 수량 설정만으로 데이터를 자동으로 수집할 수 있는 기능이 적용되어 있어 데이터 확보부터 라벨링까지 전과정을 일원화한 원스톱 프로세스를 통해 학습데이터 세트 구축 전과정의 작업 생산성을 크게 높였다.

한국정보인증 관계자는 “이번 성과를 대상으로 관련 기술에 대한 특허 등록 1건을 완료하고, MOU를 통한 사업 제휴 등 향후 사업화를 위한 기반을 마련했다”며, “구축된 고품질 학습데이터와 라벨링 프로그램이 디지털 수사 기술 발전을 위한 토대가 되기를 기대한다”고 밝혔다.

