검색

정부, 공공부문 AI 학습용 데이터 첫 전수조사

관련이슈 디지털기획

입력 :
이정한 기자 han@seyge.com

인쇄 메일 url 공유 - +

정부가 범부처를 대상으로 공공부문 인공지능(AI) 학습용 데이터 전수조사에 착수한다.

 

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 AI에 활용할 데이터 확보를 위해 ‘AI 학습용데이터 현황조사’를 10일 실시한다. 각 부처와 공공기관이 보유한 AI 학습용 데이터를 파악하고, 고품질 데이터 확보 기반을 마련하기 위해 처음 추진되는 조사다.

 

과학기술정보통신부 현판. 과학기술정보통신부
과학기술정보통신부 현판. 과학기술정보통신부

생성형 AI 확산으로 산업과 공공 전반에서 데이터 수요가 급증하고 있지만 공공기관 데이터는 기관별로 분산돼 규모와 활용 가능성을 파악하기 어려웠다. 이런 이유로 AI 기업들이 학습용 데이터로 연계·활용하는 데 한계가 있다는 지적이 제기돼 왔다.

 

정부는 ‘AI 기본법’에 근거해 전 부처를 대상으로 데이터 보유 현황을 살피고 AI 학습 활용 가능성이 큰 데이터 100종을 선별하기로 했다. 선정된 데이터는 통합제공체계를 통해 제공된다.

 

이번 조사에선 가공을 거쳐 활용할 수 있는 데이터 발굴도 추진한다. 조사 항목은 데이터 유형과 구조, 구축 목적, 제공 가능 범위 등 AI 학습 활용성을 중심으로 구성한다.

 

조사 결과를 기반으로 기관·분야별 데이터 제공 가능 여부와 가공 수준을 검토한 뒤 전문가 인터뷰와 민간 수요조사를 거쳐 100종을 선정한다. 품질 보완과 비식별 조치 등을 진행하고, 공개가 어려운 데이터는 데이터 안심 구역을 활용하기로 했다.

 

정부는 기존 AI 허브를 통합제공체계로 고도화해 공공과 민간 데이터를 쌓고, 검색과 활용이 가능한 국가 플랫폼으로 확대할 계획이다. 과기정통부 관계자는 “AI 경쟁력의 핵심은 활용 가능한 데이터에 있다”며 “공공이 보유한 데이터 자산을 체계적으로 발굴하고 이를 활용할 수 있는 기반을 발전시키겠다”고 밝혔다.


오피니언

포토

혜리, 4월부터 혼자 여름…늘씬 뷔스티에 원피스 패션
  • 혜리, 4월부터 혼자 여름…늘씬 뷔스티에 원피스 패션
  • [포토] 앤 해서웨이 '아름다운 미소'
  • 악뮤 이수현 '우아하게'
  • [포토] 김고은 '상큼 발랄'