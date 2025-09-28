정부 전산자원을 통합 관리하는 국가정보자원관리원에서 발생한 화재로 정부24, 국민신문고 등 10여개 핵심공공서비스(1등급)를 비롯한 647개 정부 업무시스템이 일시에 멈추자 정보시스템 이중화 조치 미비가 공공서비스 먹통 사태를 초래했다는 지적이 나온다.2022년 ‘카카오 먹통 사태’와 2023년 일부 행정전산망 마비 사태에도 정부가 별다른 개선책 없이 안이하게 대응하는 바람에 사상 초유의 ‘공공 전산서비스 먹통 사태’를 되풀이했다는 비판이 거세다.

28일 정부와 클라우드 업계 등에 따르면 26일 화재가 난 국정자원 전산실은 국가정보자원관리원이 행정 기관의 IT 수요를 위해 자체 운영하는 ‘G-클라우드 존’에 해당한다. 이 구역의 재난복구(DR·Disaster recovery) 시스템은 서버 재난복구와 클라우드 재난복구 두 가지가 모두 필요한 환경인데, 클라우드 DR 환경은 구축이 완료되지 않은 상황으로 파악됐다. 같은 데이터를 여러 곳에 복제해 보관하는 이중화 조치가 미비하다는 것이다. 행안부 관계자는 이날 “2023년 정부 행정 전산망이 마비된 후, 이듬해 연구용역을 한 뒤 올해 시범사업에 착수했다”며 “이후 각 부처 등 기관결 예산을 확보해 이중화 체계 추진 예정인 단계”라고 설명했다.



전문가들은 제대로 된 전산망 이중 장치가 있었다면, 행정 서비스가 마비되는 일은 없었을 것이라고 지적했다. 염흥열 순천향대 명예교수(정보보호학)는 “대전·광주·대구 분원에 이중, 삼중 시스템이 있었다면 한 곳에서 장애가 발생해도 서비스가 빠르게 복구됐을 것”이라고 말했다.

2022년 10월15일 일어난 ‘카카오 먹통 사태’를 재연했다는 비판이 나온다. 당시 SK C&C 판교 데이터센터에서 화재가 발생해 카카오 서비스가 먹통이 된 해당사고도 무정전 전원장치(UPS)용 리튬이온배터리 화재가 원인이었다. 화재 여파로 데이터센터 서비스 전원이 차단됐고, 이후 카카오, 다음, 카카오톡, 카카오T맵, 카카오페이, 멜론 등 서비스가 연쇄적으로 장애를 일으켰다. 이후 전기실과 UPS, 리튬이온배터리 관리 및 화재 위험성 문제가 대두됐다. 카카오 측은 대표가 대국민 사과를 하고 재발 방지 대책까지 발표해야 했다.



정보통신기술(ICT)업계 관계자들은 2022년 10월15일 카카오 먹통 사태도 시스템 이중화 미비가 피해를 키웠다고 지적한다.



당시 주요 서비스 데이터는 분산돼 있었지만 모니터링 시스템이나 운영 관리도구, 보안 키 저장소 등은 판교 데이터센터 쪽에 몰려있거나 이중화가 부족해 복구가 지연됐다. ICT 업계 관계자는 “주 서버가 살아있더라도 보조 시스템들이 뒤받쳐주지 않으면 정상가동이 어렵다”며 “사실상 시스템 전체 관점에선 이중화가 제대로 되지 않았던 것”이라고 지적했다.



‘카카오 대란’ 직후 ‘정부 전산망은 민간과 다르다’, ‘화재 발생 후 3시간 내 복구 가능하다’고 공언했던 정부가 시스템 이중화를 위한 별다른 개선책 없이 미온적으로 대처해 이번 사태를 초래했다는 비판이 나온다. 박기웅 세종대 교수(정보보호학)는 “(정부가) 두 시스템이 모두 문제를 일으키지 않을 것이란 가정을 세운 탓에 미흡했던 부분이 생긴 걸로 보인다”며 “시스템 설계 당시 고려되지 않았던 새로운 문제에 대한 해결책을 단기적으로 반영하는 게 쉽지 않겠지만, (앞으로) 시스템을 개선·구축할 때 외부 충격 등 여러 변수를 고려해 지속가능성을 보장토록 해야 한다”고 강조했다.

운영 시스템 자체를 이중화해야 한다는 제언도 나온다. 장애 시 다른 쪽이 자동으로 업무를 이어받는 액티브-액티브, 예비 시스템이 즉시 전환되는 액티브-스탠바이 방식을 공공 전산에도 도입해야 한다는 것이다. 또 계획만 세우는 게 아니라 실제로 전환을 해보는 장기 전환 훈련도 필요하다.



염 교수는 “똑같은 장비 2개를 만든 뒤 다른 쪽에서 문제가 생기면 다른 쪽에서 인수해서 서비스를 제공한다든지, 아니면 한쪽은 서비스를 제공하고 다른 쪽은 준비하고 있다가 가동하는 쪽에서 문제가 발생하면 스탠바이 하고 있는 곳에서 서비스를 제공하는 시스템을 구축해야 한다”고 말했다.

