새 알파고는 무엇이 달라진 걸까. 기존의 기보를 안 보고 알파고끼리 대국을 반복하는 학습만 했다는 보도가 있었지만 구글 딥마인드의 정정 발표가 있었다. 무작위성 기법 사용을 중단했다는 소문도 있는데 신빙성이 높아 보이진 않는다. 새 알파고 알고리즘을 실행한 하드웨어는 가벼워졌다. 지난해에는 1920개의 중앙처리장치(CPU)를 가진 기계와 뇌 하나의 인간이 대결하는 것은 불공정하다는 기사가 있었다. 이번에는 새로운 텐서처리장치(TPU) 2개를 사용한 하드웨어 때문에 구글의 TPU가 커제를 눌렀다는 기사가 많았다. 점입가경이다. 강력한 슈퍼컴이 없어서 그동안 이세돌과 커제를 못 이겼던 것이라고 믿는 걸까. 큰 방을 가득 채운 장치는 눈에 딱 들어오지만 그 위에서 돌고 있는 알고리즘은 눈에 보이지 않으니 어쩌랴. 최신 TPU 두 개의 연산능력은 세계 500위권 슈퍼컴의 반도 안 된다. 기계학습은 소수점 아래로 길게 가는 계산이 필요 없으므로 이것을 줄여서 계산 효율성을 높인 게 TPU다. 기상예보 같은 수치계산은 잘 못한다.
박형주 국가수리과학연구소장·아주대 석좌교수 |
알파고는 다르다. 총 361개의 착점이 있는 바둑판에서 가능한 게임시나리오가 우주에 있는 원자의 수보다 많다. 무한정 하드웨어에 투자해도 이걸 다 두어볼 수 없으니, 착점별 승리확률을 계산해낼 방법이 없다. 알파고는 이길 가능성이 작거나 고려할 필요 없는 엄청나게 많은 시나리오를 제거하고 일부만 골랐다. 30초 동안 평균 10만번 정도만 두어 보고 각 착점의 승리 확률을 계산했다. 어떤 경우를 배제할 것인가를 결정하기 위해 딥러닝(심층학습)이나 무작위 검색 등을 조합한 알고리즘을 만들었다.
그러니 알파고 사건은 하드웨어가 아니라 알고리즘의 승리다. ‘무엇을 버릴 것인가’를 잘 결정한 것이다. 그래서 AI기술의 핵심은 일부 언론이 그려낸 알파고처럼 1000여개의 두뇌를 가진 ‘계산자원’이 아니라 혁신적인 수학 알고리즘으로 ‘계산자원의 필요를 획기적으로 줄였다’라는 것이다. ‘큰 데이터를 적은 데이터’로 바꾼 것이다. 이러면 계산 안 되던 문제가 계산이 되는 기적 같은 일이 일어난다. 거대 문제를 작은 규모 문제로 바꾸면서도 정보손실을 최소화하는 수학적 알고리즘이 미래인공지능기술의 핵심인 셈이다.
박형주 국가수리과학연구소장·아주대 석좌교수
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]