바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

인공지능이 불러올 변화와 인류의 미래

2016-03-09신정수 인성정보 공동창업자·사외이사



마쓰오 유타카 지음 | 박기원 옮김 | 동아엠앤비 | 1만5000원

이 책은 인공지능과 딥러닝에 대한 지난 역사와 그 속에 담긴 기술의 발전 과정 그리고 향후 전망에 대한 종합적 안내서이다. 도쿄대에서 인공지능과 빅데이터를 연구하고 있는 저자는 이 책에서 인공지능에 관한 기술적인 디테일까지 쉬운 예를 들어가며 그림과 더불어 친절하게 설명하고 있다. 이를 통해 우리가 막연하게 알고 있던 기계학습과 딥러닝의 기술적 메커니즘을 결코 어렵지 않게 이해할 수 있게 해준다.

인공지능(AI)은 생명공학과 더불어 21세기 인류의 삶에 가장 큰 변화를 가져올 것으로 예측된다. 따라서 인공지능에 대한 글로벌 투자도 활발하다. 딥러닝 기술의 제1인자로 꼽히는 토론토대학의 제프리 힌튼 교수가 창업했던 DNN 리서치는 구글이 2013년 인수했다. 기술도 기술이지만 그 핵심 인재를 확보하기 위한 절차였던 것이다. 또 구글은 같은 맥락에서 이듬해 인원 몇 십 명에 불과한 영국의 딥마인드 테크놀로지스사를 거금 4억 달러에 인수했다.

중국 최대의 검색 사이트 바이두의 경우도 2014년 딥러닝 연구소를 만들어 3억 달러의 자금 투자와 더불어 구글 연구소에서 일하던 기계 학습의 최고 권위자 스탠포드의 앤드류 응 교수를 소장으로 전격 영입했다. 여기서 응 교수는 약 200명의 전문 인력과 함께 중국어 자동번역시스템과 자동주행자동차 등을 집중적으로 개발하고 있다. 그럼 인공지능이란 과연 무엇이며 왜 최근 들어 갑자기 이에 대한 투자가 급격히 늘어나게 되었을까?

인공지능의 레벨1은 청소기나 세탁기 등의 단순 자동제어프로그램이다. 레벨2는 장기대국프로그램이나 질문에 응답하는 대화프로그램이다. 주어진 지식베이스로 판단하며 추론도 한다. 레벨3은 빅데이터 시대의 표본 데이터를 활용하여 지식, 규칙을 기계학습 하는 것이다. 레벨4는 다계층 신경망네트웍 기술로 결과 자료를 보여주면 스스로 특징을 발견하며 ‘특징표현 학습’까지 하는 딥러닝 기술이다. 이는 회사 조직으로 치면 고위 관리자급으로 스스로 체크 항목까지 만들어내는 셈이다.

이러한 인공지능 기술의 지난 부침 과정을 차례로 살펴보면, 우선 제1차 AI 붐은 오래 전 1960년 무렵에 생겨났다. 컴퓨터로 논리적인 추론, 탐색이 가능하다는 전제하에서 추론시스템(inference system)용 프로그램 언어(LISP, PROLOG등)들도 개발되었다. 하지만 단순한 문제는 풀 수 있어도 현실의 복잡한 문제는 감당이 되지 않는다는 것을 깨닫고 곧 꼬리를 내렸다. 그리고 1970년대는 AI의 긴 겨울이었다.

제2차 붐은 1980년대이다. 그 때는 컴퓨터에 전문가의 지식을 저장하고 활용할 수 있다는 믿음으로 전문가시스템(expert system)의 실용화에 대한 꿈에 부풀었다. 그러나 상황에 맞는 관계지식만을 사용해야 하는 프레임 문제, 기호와 그 의미들을 연결시켜야 하는 심벌 그라운딩 문제 등이 발생한다. 따라서 다양한 개념, 지식을 체계적으로 서술, 관리한다는 것이 너무 방대한 일이라는 현실 인식에 투자도 끊어지며 1995년 무렵 AI는 다시 겨울로 진입해버렸다.

2000년대 들어 인터넷과 웹이 폭발적으로 보급되고 도처에 대량 데이터가 발생하는 시점에서 '기계학습' 이야기가 나오기 시작했다. 3차 AI 붐은 2010년대에 이르러 빅데이터 기반의 기계학습, 딥러닝의 두 파도와 함께 찾아왔다. 특히 2011년 제퍼디 퀴즈쇼에서의 IBM의 왓슨 프로젝트 성공은 기념비적인 사건으로 인공지능의 새로운 가능성을 일깨웠다. 이제 구글의 인공지능바둑 알파고가 인류의 자존심 이세돌 9단마저 꺾는다면 세상은 발칵 뒤집혀질 것이다.




기계 학습이란 무엇일까? 이는 대상을 분류하는 능력이며 Yes와 No로 대답하는 문제라고 할 수 있다. 이 책에서는 최근접 이웃방법, 확률을 이용한 나이브 베이즈(Naive Bayes)법, 결정 트리(decision tree)법, 데이터 그룹 간 간격을 최대화 하는 서포트 벡터(Support Vector) 머신 방법과 뇌신경회로, 시냅스를 모델화한 신경망 네트워크 방법론까지 제법 자상하게 소개하고 있다. 이 중 신경망 네트워크 모델은 뇌의 경우 자극에 의해 시냅스 결합도가 변화하듯이 기계학습을 통해 가상적 연결선의 가중치를 미세하게 조정하는 방법을 쓰는 방식이다.

그런데 2012년 ILSVRC라는 이미지 인식 대회에서 토론토대학의 수퍼비전(SuperVision)이 큰일을 벌였다. 기존의 기계학습 방법으로는 26% 에러율을 극복하기 어려웠는데, 2등과는 현격한 차이로 15%라는 경이적으로 낮은 에러율을 보여주었기 때문이다. 이는 최신 '딥러닝' 기술로서 다층의 신경망 네트워크를 구축하고 각 계층별 학습에 오토인코더(auto-encoder)라는 정보량 압축기를 사용한다. 또한 노이즈를 주어서 신뢰도 높은 주성분도 찾아낸다.

토론토 대학의 제프리힌슨 교수가 선도한 이 딥러닝 기술은 데이터를 바탕으로 계층마다 특징들을 정제해내는 '표현 학습'이 그 핵심이다. 인간의 뇌나 기업의 조직 구조처럼, 아래 계층은 구체적인 현장 특성을 보고 위로 올라갈수록 추상도가 올라가며 맨 위에는 가장 대국적인 정보를 본다. 이를 통해 기존 인공지능의 한계를 돌파하면서 대상 인식, 지식 획득, 자동 번역, 행동과 결과의 예측 등 다양한 영역에서 놀라운 성과들을 만들어낼 수 있다.

인공지능의 미래에 대해서는 미래학자 레이 커즈와일의 싱귤래리티 즉, IT, BT, NT가 시너지를 이루면서 AI는 인류의 지능을 넘어서는 기술의 특이점 시대에 도달할 것으로 본다. 한편, 테슬라의 엘론 머스크 같은 사람은 AI는 악마를 부르는 꼴이 될 수 있음을 경고하기도 한다. 하지만 인공지능의 전문가로서 저자가 내리는 결론은 대체로 긍정적이다.

저자는 ‘기계의 자기재생산’의 구조적 어려움과 비현실성을 강조하면서 결국 기계와 인간이 뒤섞이는 사회가 될 것으로 본다. 다만 최악의 상황에 대한 대응책은 마련해두어야 하며, AI가 인간의 존엄성을 무너뜨려서는 안 된다는 윤리관, 인공지능 기술의 사전 투명성, 그리고 그 제어권의 분산(시민)에 대한 논의도 있어야 한다고 주장한다. 그 밖에 일자리의 변화와 부의 재분배에 대한 사회적 성찰과 대책도 마땅히 필요하다고 본다.

그런데 어떤 직종이 사라지고 어떤 직종이 살아남을 것인가? 인공지능의 활동범위가 인간의 지적 노동 분야로 확대됨에 따라 향후 이미지 진단, 방범, 운전, 간병, 콜센타, 통역, 교육 등의 분야까지 단계적으로 침범하게 될 것으로 분석한다. 또한 의료, 법무, 회계, 금융 등의 전문직 일도 매우 큰 영향을 받을 것이며, 나중엔 음악과 미술 같은 예술 분야에서조차 학습을 통해 인간을 만족시키는 콘텐츠들을 생산해낼 가능성도 있다고 보았다.

하지만 저자는 인간과 기계가 협조할 때 최상의 결과가 나올 수 있으며, 최후의 경영적 판단은 인간에게 남겨져야 하고, 인간과 가깝게 접하는 인터페이스는 인간이 하는 것이 좋을 것이라는 점을 지적한다. 어쨌거나 인공지능 기술 경쟁력은 점점 중요해질 것이며 향후 관련 전문 인력 전쟁도 극심해질 것이다. 우리는 지금 무엇을 어떻게 준비해나가고 있는가?