바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

"차세대 인공지능, 스몰데이터 기반 트랜스퍼 러닝 주목하라"

이경일 솔트룩스 대표 "딥러닝 한계 넘어야 AI 진화 가능"

2017-12-13황치규 기자

테크M은 12월호에서 딥러닝의 아버지로 불리는 제프리 힌튼 토론토대 교수 등의 말을 인용해 현재 딥러닝 기술의 한계를 조명했다.

얼핏보면 딥러닝 기술이 진화를 거듭하고 있는 듯 보이지만 현실은 30년전에 나온 기술 프레임에 기반하다보니 한계도 적지 않다는 것.

현재 딥러닝 기술의 한계를 지적하는 목소리는 최근 점점 확산되는 양상이다. 국내 인공지능 기술 업체 솔트룩스의 이경일 대표도 딥러닝이 인공지능의 모든 것이 될 수는 없다고 강조한다.

그는 딥러닝에 대한 과도한 판타지를 경계할 필요가 있다는 점을 분명히 했다.

 

딥러닝과 지식그래프 융합해야 
"딥러닝은 기계학습의 한종류로 인공지능의 일부일 뿐이에요. 경험적 사실에서 판단하는 귀납적 추론에 기반합니다. 그러나 이것만으로 인간의 뇌를 따라갈 수 없어요.인간의 뇌는 연역적, 귀납적, 유비적 추론을 같이 합니다. 인공지능도 그래야 하는데 지금은 분리돼 있어요. 이걸 어떻게 결합시키느냐가 차세대 인공지능의 핵심입니다. 여기에다 딥러닝은 결과가 나오기까지의 과정을 논리적으로 설명할 수 없는 문제가 있습니다. 의사 결정에 따른 배경을 알 수 없다면 쓰는데도 한계가 있게 마련이죠."
 
차세대 인공지능에 대한 이경일 대표의 생각은 대충 이렇게 요약된다.

딥러닝은 인공지능이라는 동전의 한쪽이며, 인공지능이 진화하려면 동전의 양 면을 결합해야 한다는 것이다. 인공지능이라는 동전의 다른 한쪽은 지식그래프다.

"인공지능에는 기호적, 비기호적 접근 두 가지 방식이 있습니다. 기호적 접근은 인공지능이 지식을 축적하고 학습하는 것을 수학적 기호로 표현하는 것입니다. 지식그래프나 온톨로지 같은 기술이 여기에 해당됩니다.

마인드맵처럼 지식을 표현하는 것이  지식그래프고, 지식 그래프가 발전한 것이 온톨로지에요. 기호적 접근이 갖는 장점은 딥러닝과 달리 결과가 나온 이유를 설명할 수 있다는 겁니다.

하지만 지식 기반을 구축하는데 많은 비용이 들어갑니다. 데이터를 논리적, 수학적으로 표현하는데 따른 사람의 품도 많이 들고요."

딥러닝은 비기호적 접근 방식에 해당한다. 인공지능을 대표하는 기술로 통하지만, 제대로 쓸 수 있느냐의 관점에서 보면 딥러닝은 제약이 많은 것도 사실이다.

"딥러닝을 하려면 많은 데이터가 필요합니다. 예로 들면 데이터가 많아야 인공지능 성능도 좋아집니다. 하지만 대규모 데이터를 갖추는게 만만치 않아요. 어마어마한 노력이 들어갑니다. 딥러닝에 투입할만한 데이터를 확보할 수 있는 분야가 많은 것도 아니고요."

이경일 대표는 딥러닝과 지식그래프 모두 일장일단이 있는 만큼, 둘을 통합해야 한다는 것을 거듭 강조한다.

무게 중심을  어느 한쪽에 둘 수는 있지만 한쪽에 올인하는 것은 한계가 있다는 얘기다. 시장 상황도 이미 이같은 방향으로 움직이고 있다.

이 대표는 지식그래프와 딥러닝을 버무려 쓰는 사례로 챗봇을 들었다. 챗봇의 경우 지식그래프를 중심으로 딥러닝이 측면 지원하는 형태로 많이 운영된다고 한다.

솔트룩스의 차세대 인공지능 기술 개발 전략도 지식그래프와 딥러닝의 융합에 초점이 맞춰져 있다.

그동안 지식그래프 개발에 주력해온 솔트룩스는 최근들어 딥러닝 기술 개발에도 속도를 내기 시작했다. 지금은 전체 인공지능 역량에서 지식그래프 비중이 60~70% 정도 되지만 궁극적으로 딥러닝과 지식그래프 비율을 5대 5로 만드는 것이 목표다.

스몰데이터 기반 트랜스퍼러닝 개발 가속
지식그래프와 딥러닝의 융합 외에 대규모 데이터가 없더라도 딥러닝을 다양한 분야에서 활용할 수 있게 하는 것도 이경일 대표가 강조하는 차세대 인공지능의 핵심 중 하나다.

딥러닝은 크게 지도 학습과 비지도 학습으로 나눠진다.

사과를 예로 들어 보자. 지도학습은 사과 이미지가 사과라고 가르치기 위해 몇만 장의 사진이 필요하다. 이세돌과 싸웠던 알파고도 지도학습에서 성장하고 비지도학습으로 더 똑독해졌다.

비지도 학습은 사과라고 가르쳐주지 않았는데도 인공지능이 알아서 사과라고 알게 하는 보다 고난도의 기술이다. 비지도학습 역시 엄청난 데이터를 필요로 한다.

앞에서도 지적했듯 딥러닝에 필요한 대규모 데이터를 확보하는 것은 하고 싶다고 할 수 있는 성격의 일이 아니다. 딥러닝에 필요한 데이터를 확보하는 것 자체가 어려운 분야도 수두룩하다.

딥러닝으로 성과를 낼 수 있는 분야가 보기와 달리 제한적일 수 있다는 얘기다.
 
이와 관련해 이경일 대표는 '트랜스퍼 러닝'을 해법으로 제시한다. 트랜스퍼 러닝은 소규모 데이터로도 딥러닝의 효과를 체감할 수 있게 한다. 

딥러닝이 제대로 돌아가는데 있어 가장 중요한 요소인 대규모 데이터 없이 딥러닝을 논하는 것은 넌센스가 아닐까? 현재 빅데이터 기술은 데이터양 뿐만 아니라 데이터 품질도 동시에 확보되어야 한다는 것이 규모의 문제를 풀 수 있다는 것이 이경일 대표 설명이다.

"딥러닝은 데이터 양이 두 배 늘면 인공지능 품질이 1.5배 정도 좋아집니다. 하지만 데이터 양 만큼이나 중요한게 데이터 품질이에요.  품질이 5%만 좋아지면 인공지능 품질은 1.5배 향상됩니다. 그만큼, 데이터는 품질이 중요하고 그걸 결정하는 것이 바로 알고리즘입니다."

솔트룩스는 트랜스퍼 러닝을 기술을 내년에 선보인다는 계획이다. 지식그래프와 딥러닝을 융합하는 기술은 중장기 과제로 삼고 상용화를 준비중이다.

솔트룩스가 파고드는 인공지능 시장은 기업이다. 개인용 시장에 비해 주목도가 덜하기는 하지만  최근들어 기업용 시장도 인공지능 생태계의 격전지로 부상했다.

개인용 시장에 주력하던 아마존까지 최근 음성 인공지능 비서 알렉사를 앞세워 기업 시장 공략에 출사표를 던졌다. 

이와 관련해 이경일 대표는 기업 시장에서 아마존과 경쟁할 가능성은 낮게 봤다.

아마존이 노리는 기업용 인공지능 시장은 음성 명령이 먹혀드는, '커맨드 앤 컨트롤' 영역이다. 사물인터넷(IoT)이나 오피스 자동화가 대표인데, 솔트룩스와는 활동 무대가 겹치지 않는다는 것이 이 대표 설명이다. 

솔트룩스는 지식 그래프와 딥러닝 기술을 기반으로 기업내 핵심 시스템과 연동되는 인공지능 플랫폼 개발에 주력하고 있다.

"ERP나 공급망관리(SCM) 같은 핵심 시스템은 알렉사가 들어갈 시장이 아닙니다. 의사 결정이 필요한 곳도 마찬가지고요. B2B와 B2C는 기대 수준이 다릅니다. 금융거래를 예로 들면 정확도가 98%까지 올라가야 합니다. 그리고 관리 가능해야 합니다.

운영하고 관리할 수 있는 체계도 필요하고요. 아마존 알렉사가 기업 시장에서 일정 부분 통할 수는 있겠지만 기간계 시스템이나 경영에 필요한 의사 결정 분야까지 치고 올라오기는 쉽지 않을 거에요."

솔트룩스는 인공지능에 대한 관심이 고조되는 분위기를 등에 업고 올해 매출이 지난해 99억원에서 30% 이상 증가한 130억원 규모가 될 것으로 보고 있다.

기업 시장 공략에 속도를 내기 위해 내년에 차세대 인공지능 엔진인 에바도 공개할 예정이다.

해외 시장 공략에도 속도를 내는 모습. 최근 글로벌 음성 인식 인공지능 업체인 사운드하운드와 제휴를 맺은 것도 미국 시장진출 전략의 일환이다.

이경일 대표는 "사운드하운드 제품에 솔트룩스 기술을 탑재해 미국 시장에 진출할 수 있는 발판을 마련했다"고 평가했다.

[테크M=황치규 기자(delight@techm.kr)]