바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

엔비디아, 반려동물 표정 구현하는 최신 AI 기술 발표

2019-10-30김태환 기자

인공지능(AI) 컴퓨팅 기술 분야의 선두주자인 엔비디아가 동물 사진을 보고 표정이나 포즈를 다른 동물에 똑같이 구현하는 ‘GANimal’ 애플리케이션 관련 논문을 30일 발표했다.

GANimal은 생성적 적대신경망(Generative Adversarial Networks, 이하 GAN)이라는 새로운 AI 기술을 기반으로 개발됐다. GAN은 두 개 네트워크로 구성된 심층 뉴럴 네트워크 구조로 한 네트워크가 다른 네트워크와 서로 대립해 경쟁하는 방식으로 학습을 진행하는 기술이다.

새롭게 개발된 GANimal 애플리케이션을 통해 개나 고양이 사진을 업로드하면, 사진 속 동물 표정과 포즈를 아프리카 사냥개나 이집트 고양이에서 시추, 눈표범 등 수십 종의 동물에 적용할 수 있다.

이 기술을 적용하면 영화를 촬영할 때 묘기를 부리는 개 모습을 찍은 뒤, 그 움직임을 AI로 매핑해 다루기 위험한 호랑이에 적용할 수 있다.

GANimal에는 ‘푸닛(FUNIT, Few-shot, UNsupervised Image-to-image Translation)’이라고 부르는 알고리즘을 사용했다. 이는 테스트 진행 시 몇 개 예제 이미지 만으로 전에는 볼 수 없었던 타겟층에 적용되는 기술이다.

리우 밍유 엔비디아 푸닛 기술 개발팀 연구원은 “대부분의 GAN 기반 이미지 변환 네트워크는 오로지 한 개 작업을 처리하도록 하지만 우리는 단일 네트워크가 다양한 변환작업을 처리할 수 있게 학습시킨다”면서 “각 작업에서는 무작위로 선정된 소스 동물을 임의로 선정해 타겟 동물 이미지에 사용해 해당 타겟 동물로 변환시킨다. 네트워크는 다양한 이미지 변환 작업을 처리하면서, 기존 동물 모습을 일반화해 전에 볼 수 없었던 새로운 동물 이미지로 변환할 수 있다”고 설명했다.

기존에 이미지를 변환하려면 여러 장의 타겟 동물 이미지를 네트워크 모델에 학습시켜야 했다. 하지만 이제는 연구진이 GAN 프로세스에 추가하는 다양한 이미지 변환 작업 등으로 구성된 훈련 기능을 통해 사진 한 장으로 이미지를 변환할 수 있다.

리우 연구원은 “인간의 상상력을 뉴럴 네트워크에 코딩한다는 개념이 최종목표”라며 “새로운 문제들을 해결해 나가는 것이 기술과 사회를 발전시키는 길”이라고 소감을 밝혔다.

한편 엔비디아의 200여 명 연구진 중 핵심 연구원 7명으로 이뤄진 엔비디아 푸닛팀은 최신 푸닛 툴에 더 많은 이미지를 더 높은 해상도로 포함할 예정이다. 최근에는 고해상도 꽃, 음식 이미지로 테스트를 진행하고 있다.

 

김태환 테크엠 기자 kimthin@techm.kr