바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

[MIT선정 젊은 혁신가들] 배운 내용으로 스스로 학습하는 로봇 개발

2016-11-02MIT테크놀로지리뷰


세르게이 레빈 (캘리포니아대, 버클리 캠퍼스)

그는 로봇이 자신의 성공을 통해 스스로 배우도록 로봇을 가르친다.



구글에서 아홉 달을 일하는 동안, 그는 구글의 알파고가 바둑에서 인간 최고수를 이기는 것을 보았다. UC 버클리의 로봇 전문가인 레빈은 머신 러닝의 능력에 감탄하면서도 이 강력한 바둑 알고리즘에 커다란 단점이 있다는 생각을 떨칠 수 없었다.

“알파고가 스스로 배운 건 하나도 없어요.”

알파고의 신경망은 마치 동물의 사진을 구별하기 위해 수많은 고양이와 개 사진을 입력해야 하는 것처럼, 16만 건의 기보를 보고 훈련했다. 하지만 로봇 팔은 이런 방법으로 훈련시킬 수 없다.

따라서 로봇 공학자들은 다른 방법을 사용한다. 이들은 로봇에게 병뚜껑을 닫으라는 명령을 준 뒤 구체적인 방법은 스스로 배우도록 한다. 로봇은 이 과제를 수없이 반복하다가 마침내 목표를 이룬다. 하지만 이 방법은 수많은 시도를 해야 하며, 더구나 어려운 과제는 이 방법이 통하지 않는다.

레빈은 사진을 분류할 때 유용했던 것과 같은 종류의 알고리즘을 사용함으로써 이 분야에 새로운 혁신을 이루었다. 그는 먼저 로봇에게 병뚜껑을 닫는 것과 같은 간단한 과제를 준 뒤 로봇으로 하여금 과거 자신의 성공으로부터 배우도록 했다.

로봇은 자신의 영상 장치에 들어오는 데이터와 로봇 팔이 과제를 제대로 수행했을 때의 동력 신호를 관찰한다. 즉, 로봇은 자신의 학습을 바탕으로 지도하는 것이다. “이는 자신의 행동에 대한 리버스 엔지니어링 입니다.”

로봇은 이제 이렇게 배운 내용으로 다른 비슷한 작업을 할 수 있게 된다. 이 인공지능 기술은 학습 효율을 크게 올렸고, 과거 불가능했던 로봇 작업이 가능하게 되었다. 로봇의 지능이 갑자기 올라간 것이다.

<본 기사는 테크M 제42호(2016년10월) 기사입니다>

뉴스