생성형 인공지능(AI) 개발 경쟁에서 미국·중국 등에 뒤쳐진 일본이 민관 협력으로 ‘일본산 AI’ 개발에 나선다. 외국 AI 의존이 심화하면 데이터의 해외 유출이나 일본에 관한 잘못된 정보의 확산 등 안전보장상 우려가 크다고 보고 자국 데이터나 기술을 바탕으로 한 AI 개발이 필수적이라고 판단한 것이다.

18일 요미우리신문에 따르면 일본 총무성 소관 국립연구개발법인 정보통신연구기구(NICT)가 20년간 수집한 일본어 데이터를 AI 전문기업 프리퍼드네트웍스에 제공, 일본의 문화·습관·제도 등에 관해 신뢰성이 높은 답변을 내놓는 AI를 공동 개발하기로 했다.

이 AI는 정보통신(IT)기업 사쿠라인터넷이 일본 내 데이터센터를 통해 서비스를 제공하고, 일본 정부나 지방자치단체, 기업 등이 활용하는 방안을 염두에 두고 있다.

일본 총무성과 경제산업성은 양질의 일본어 데이터 정비, 스타 기술자 영입, 개발 인프라 제공 등에 필요한 자금을 제공하는 방식으로 AI 개발을 지원할 계획이다.

AI 학습에 사용하는 데이터 제공이나 대규모언어모델(LLM) 개발, 데이터센터 운영을 모두 일본 기업이나 기관이 담당해 일본 내에서 완결되는 형태의 생성형 AI를 개발·제공하는 것이 목표다.

일본에서는 챗GPT, 딥시크 등 외국 AI 활용이 확산하는 가운데 외국산은 학습 데이터 등 개발 과정이 불투명하다는 우려가 나온다. 일본 정부 관계자는 신문에 “일본으로서는 허용할 수 없는 데이터가 학습되고 있을 가능성도 있다”고 말했다.

외국 AI가 영어 데이터를 중심으로 학습하는 까닭에 일본 문화·역사 등에 대한 이해가 충분하지 않거나 개발국의 주장에 편승한 대답을 내놓는 점도 일본 정부의 걱정거리다. 앞서 자민당 오노데라 이쓰노리 정무조사회장은 중국 AI 딥시크에 ‘센카쿠(尖閣·중국명 댜오위다오)는 일본 영토인가’라고 물었더니 “센카쿠는 역사적으로, 국제법적으로도 중국 고유의 영토”라는 답을 받았다며 딥시크를 내려받아서는 안 된다고 주장한 적이 있다.

글로벌 AI 성능 분석 전문 기관인 ‘아티피셜 애널리시스’가 지난 7월 내놓은 AI종합지수에서는 상위 20권에 미국이 14개, 중국이 5개 모델 이름을 올렸다. 나머지 1개는 프랑스 미스트랄의 마지스트랄 스몰이었다. 요미우리는 “미국과 중국이 개발한 AI를 주로 활용하는 일본 기업도 늘고 있어서 해외 AI 의존에 대한 우려가 확산하고 있다”고 전했다.

