바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

10대 혁신 기술: 두 신경망의 결투

2018-05-04독점제휴=MIT테크놀로지리뷰

[테크M 독점제휴=MIT테크놀로지리뷰] 두 인공지능 알고리즘이 데이터를 바탕으로 고양이와 쥐 게임을 벌임으로써 상상력을 얻게 된다.


  • 혁신성 두 인공지능 시스템이 보다 현실적인 사진이나 소리를 만들어내기 위해 경쟁함으로써 기존 방식으로는 할 수 없었던 일을 할 수 있다.
  • 왜 중요한가 이 기술은 기계가 상상력과 유사한 것을 갖게 함으로써 보다 사람에게 덜 의존하게 만든다. 하지만 매우 강력한 디지털 위조도구가 될 수도 있다.
  • 주요 회사들 구글브레인 / 딥마인드 / 엔비디아
  • 실용화 시기 지금

인공지능은 사물을 판별하는데 매우 뛰어나다. 예를 들어 100만장의 사진을 학습한 이후, 인공지능은 길을 건너는 보행자의 사진을 놀라운 정확도로 구별해 낼 수 있다. 하지만 인공지능은 보행자 사진을 스스로 그릴 수는 없다. 이게 가능하다면, 인공지능으로 하여금 다양한 상황의 보행자 사진을 많이 만들게 한 후 자율주행차가 이 사진을 학습하게 할 수 있을 것이다.

문제는 새로운 것을 만드는데 필요한 상상력이 인공지능에는 아직 없다는 점이다.

2014년 몬트리올 대학 박사과정 학생인 이안 굿펠로우는 한 술집에서 이 문제에 대한 해결책을 처음 떠올렸다. 생성적 적대신경망, 혹은 GAN이라 불리는 이 기술은 두 개의 신경망 - 인간의 두뇌를 흉내낸 것으로 오늘날 기계학습의 기본이 된 기술 - 이 서로 디지털 버전의 고양이와 쥐 게임을 하며 경쟁하게 하는 것이다.

두 신경망은 같은 데이터를 학습한다. 생성자로 불리는 하나의 신경망은 보행자가 팔을 하나 더 갖게 하는 식으로, 자신이 이미 학습한 이미지에 변형을 준 이미지를 만들어 낸다. 두번째 신경망인 구별자는 생성자가 만든 이미지가 진짜인지 가짜인지를, 곧 팔이 셋인 사람이 진짜 사람인지를 판단한다.

이를 계속 반복할 경우 생성자는 구별자가 구별할 수 없는 진짜같은 가짜 이미지를 만들어내게 된다. 곧, 생성자는 기존 데이터를 바탕으로 진짜같이 보이는 보행자 이미지를 만들어 내게 되는 것이다.

이 기술은 지난 10년 동안 인공지능 분야에서 등장한 기술 중 가장 가능성이 큰 기술이며 심지어 기계로 하여금 사람을 속일 수 있는 결과를 만들도록 할 수 있다.

GAN은 실제 사람이 말한 것과 같은 목소리와 진짜 사진 같은 이미지를 만드는데 사용되고 있다. 엔비디아의 경우 유명인의 사진으로 학습시킨 GAN을 통해 현실에는 존재하지 않는 수백명의 얼굴을 만들어 냈다. 다른 연구팀은 반고흐의 작품과 비슷한 그림을 만들었다. 이를 더 확장할 경우 맑은날 도로를 눈이 덮인 것처럼 보이게 바꿀 수 있고 말을 얼룩말로 바꿀 수도 있다.

물론 그 결과가 언제나 완벽한 것은 아니다. GAN은 손잡이가 두개 달린 자전거를 만들어내기도 하고 눈썹이 잘못된 위치에 있는 얼굴을 그리기도 한다. 그러나 GAN이 만들어 내는 이미지와 소리는 종종 너무 현실적이어서 어떤 전문가들은 GAN이 자신이 보고 듣는 세상에 대한 어떤 식으로든 이해하고 있다고 믿는다. 이는 인공지능이 어쩌면 세상을 이해하는 보다 독립적인 능력인 상상력을 얻었음을 의미하는 것일지 모른다.

<본 기사는 테크M 제60호(2018년 4월) 기사입니다>

뉴스