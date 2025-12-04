보안 합성데이터 및 AI 프라이버시 전문 기업 큐빅(CUBIG)은 공공기관이 개인정보가 포함된 고위험 데이터도 안전하게 개방·공유할 수 있도록 지원하는 합성데이터 인프라 솔루션 'DTS(Data Transform System)'를 앞세워 'AI-Ready 공공데이터' 구축 수요에 본격 대응한다고 밝혔다.

행정안전부는 최근 공공데이터포털 개방 데이터가 10만 2천 건을 돌파했다고 발표하며, 양적 확대에서 고가치·AI 친화 데이터 중심의 질적 개방으로 정책 방향을 전환하고 있다. 2025년 공공데이터 제공 및 데이터기반행정 평가편람에서는 'AI 친화 및 고가치 데이터 개방 노력', '가명정보 제공 또는 합성데이터 개방 실적(가점)' 등 새로운 지표를 도입해 가명정보와 합성데이터를 활용한 데이터 개방을 사실상 필수 과제로 제시했다.

개인정보보호위원회 역시 합성데이터 생성·활용 안내서를 배포하며, 실제 데이터를 직접 사용하지 않고도 구조적·통계적 특성을 재현하는 합성데이터를 통해 개인정보 보호와 데이터 활용을 동시에 달성할 수 있다고 강조했다. 이러한 정책 흐름 속에서 합성데이터는 공공데이터를 AI 학습·정책 연구·민간 서비스 개발에 바로 활용할 수 있는 'AI-Ready' 형태로 안전하게 전환하는 핵심 기술로 주목받고 있다.

큐빅의 DTS는 공공기관 내부망에 있는 원본 데이터를 외부로 반출하지 않고, 통계적 패턴만을 학습해 완전히 새로운 합성데이터를 생성하는 원본 비접근(Non-Access) 구조를 채택했다. 생성 과정에는 차등정보보호(Differential Privacy) 등 최신 프라이버시 보호 기술을 적용해 특정 개인을 역추적하거나 재식별할 가능성을 수학적으로 통제한다.

또 공공기관의 신뢰도를 위해 합성데이터의 통계적 유사도, 모델 성능, 재식별 위험도를 정량적으로 검증하는 기능으로 합성데이터의 품질과 안전성을 객관적으로 확인한 뒤 개방 여부를 결정할 수 있어 데이터 3법, 개인정보보호법, GDPR 수준의 규제를 준수하면서도 민원·복지·보건·교통 등 고위험 데이터를 안전하게 개방ㆍ공유할 수 있다

큐빅의 합성데이터 생성 엔진 ‘DTS’는 표 형태의 행정 데이터뿐 아니라 민원 텍스트, 의료·산업 이미지, 센서·로그와 같은 시계열 데이터까지 하나의 플랫폼에서 처리할 수 있도록 설계됐다. 이를 통해 기관은 공공데이터포털에 개방할 개인 및 민감정보 데이터셋을 합성데이터로 안전하게 구축하거나 부처 간 결합·분석을 위한 통합 데이터 레이크를 AI-Ready 형태로 마련할 수 있다.

큐빅 배호 대표는 "정부가 공공데이터포털 10만 건 시대를 넘어 AI 시대에 걸맞은 질적 개방을 추진하는 만큼 이제는 '열 수 있는 데이터'가 아니라 '바로 학습에 활용할 수 있는 데이터'가 필요하다"며 "DTS는 공공기관이 재식별 우려 없이 민간·연구기관과 데이터를 공유하고 동시에 자체 AI 서비스와 데이터 기반 행정을 고도화할 수 있는 인프라이자 합성데이터의 품질과 프라이버시 수준을 검증해주는 기준이 될 것"이라고 설명했다.

큐빅은 앞으로 중앙부처, 지자체, 공공기관을 대상으로 공공데이터 개방·AI 시범사업을 확대하고 합성데이터 기반 공공데이터포털 AI-Ready 데이터셋 구축, 부처 간 합성데이터 결합 분석 사례 등을 단계적으로 선보일 계획이다.

