바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

어린아이 같이 질문에 되물으며 학습하는 마인드AI

신경망 AI와 달리 연계 질문에서 의중 파악…“대전제에 따른 소전제 확인 가능”

2019-02-14김태환 기자

이정환 마인드AI 대표가 자사 AI 알고리즘에 대해 설명하고 있다.

 “지금까지 AI는 그저 굉장히 빠른 계산기에 불과합니다.”

이정환 마인드AI 대표는 자신감에 찬 목소리로 말했다. 신경망 기법으로 구성한 AI는 참과 거짓을 구분하는 방식으로 동작한다. 수많은 데이터를 학습해야만 인식할 수 있고, 그 덕분에 정확도가 높아진다.

하지만 마인드AI 알고리즘은 대전제와 소전제를 기반으로 결과 값을 추론한다. 대전제나 소전제가 온전치 않을 때는 사용자에게 되묻기도 하고, 대전제를 기반으로 소전제를 예측하기도 한다.

지금까지의 AI와 같이 단방향으로만 추론하지 않고 대전제와 소전제를 이동하며, 마치 사람처럼 사고하는 진정한 AI라는 주장이다.

 

인간 지식습득 방식 본뜬 ‘캐노니컬’ 알고리즘

최근 인공지능(AI) 알고리즘을 개발하는 스타트업 마인드AI는 기자 간담회를 열고 독보적인 AI 알고리즘 ‘캐노니컬(Canonical)’을 공개했다.

캐노니컬은 인간 지식습득 방식을 반영해 주어진 데이터를 역으로 추적하는 논증 구조를 가진다. 지금까지 신경망 기법을 활용한 AI 알고리즘은 이미 결정된 구조를 가지고 학습한다.

예를 들어 리모콘을 바닥에 떨어트렸다고 가정했을 때 원인은 중력의 작용이고, 결과는 바닥으로의 추락이다.

만일 기존 신경망 기법 AI를 활용해 이 현상을 증명하려면 중력이 있는 상황, 없는 상황, 테이블이 있는 경우, 리모콘 무게가 무거울 때와 중량이 0인 상태, 대기 유무 같이 적게는 수십 가지, 많게는 수천만 가지 상황을 일일이 입력해야 한다.

반면 마인드AI 캐노니컬 구조는 ‘중력이 작용할 경우 질량이 있는 물체는 바닥으로 떨어진다’는 대전제를 활용해 리모콘이 바닥으로 떨어진다는 결과 값을 도출한다.

만일 대전제가 온전치 않거나 정보가 없다면, 알고리즘은 오히려 소전제를 활용해 대전제를 추론한다. ‘리모콘이 땅바닥에 떨어졌다 -> 그 이유는 힘이 작용하기 때문이다 -> 그 힘은 중력이다’는 방식으로 역으로 추론할 수 있다.

이정환 마인드AI 대표는 “기존에 있던 디시전 트리(decision tree) 방식의 AI와 다르게 캐노니컬은 자연어 처리 기법을 구조적으로 설명하면서 삼각형 형태로 조직을 만들고, 질문 들어왔을 때 조직 안에 있는 노드와 연결선을 쫓아가면서 이론적으로 이해하기 시작하는 방식”이라며 “단순히 예스-노로 나누는 게 아니라 입체적으로 사고한다. 세포가 있고 그 안에 핵이 있는 것처럼, 삼각형 구조 안에서 상하좌우로 왔다갔다 하며 생각을 하는 방식”이라고 설명했다.

실제 2월12일 마인드AI는 베타모델 ‘딜라이트’를 활용해 동화 ‘어린왕자’를 읽고 추론한 뒤 결론을 내놓는 과정을 시연했다. 동영상으로 관련 내용을 볼 수 있다.

 

 

보아뱀이 코끼리를 먹었다는 내용과 연관해 “먹는(eat) 행동은 왜 일어나는가”라는 질문에 “왜 먹어야 하지?”라는 의문을 갖게 되고, “살기 위해 먹는다”는 결론을 도출했다. ‘살려면 먹어야 한다’는 대전제를 추론하고자, 왜 먹는지를 스스로 찾는다는 점이 지금까지 AI와 차별성이다.

 

AI 자연스러움 높아질 수 있어

이렇게 하면 AI 응용분야에서 자연스러움이 훨씬 높아질 개연성이 크다.

만일 챗봇이나 인공지능 스피커에 캐노니컬 알고리즘을 적용할 경우 마치 진짜 인간과 상담하는 것처럼 구현할 수 있다.

예를 들어 현재 인공지능 스피커는 ‘사랑해’ 라고 말할 때, 사용자가 사랑해라는 말을 했을 때 반응을 직접 입력하고, 그 입력된 내용을 답한다.

반면 캐노니컬은 사랑해라고 말하면, 사랑한다는 뜻이 무엇인지 되묻기도 한다. 어떤 답이 나오는지를 들은 뒤 축적하고, 이후에 사랑해라는 말에 대해 자신이 터득한 자연스러운 답변을 내놓을 수 있다.

캐노니컬 구조를 도입하면 특히 AI에 대한 투명성을 높일 수 있다고 이 대표는 설명했다.

지금까지 AI는 결과 값에 대한 설명을 못했다. 알파고로 예를 들면, 코딩된 알고리즘에 의하면 A라는 포석을 놓았을 때 승률이 가장 높았다고 치면 왜 승률이 높은지를 판단할 수 없다. 그저 여기에 놓아야 높다는 결과만 덩그러니 있게 된다. 만일 이유를 추론하기 위해 역산하면 수천만 가지에 달하는 경우의 수를 모두 검토해야 한다.

반면 캐노니컬 구조는 한 수를 둘 때 이미 대전제 판단근거가 마련된 다음 둔다. 수를 놓기 전에 대전제가 마련되지 않으면 이해를 하고 넘어가는 형식이다. 이에 AI 응용 프로그램이 문제를 일으킬 경우 원인을 쉽게 파악할 수 있다는 장점을 가진다.

 

온톨로지 기반 블록체인 생태계 조성

마인드AI의 정확도는 온톨로지(합의된 명제)가 많을수록 올라가는 구조다. 궁극적으로는 은유적 표현까지도 이해하는 단계까지 올라설 수 있다고 마인드AI 개발진은 추측하고 있다.

이 대표는 “온톨로지 확보는 어린아이가 새로운 것을 배우고 학습하는 것과 마찬가지”라며 “계속 받아들이면 a와 b를 연결하지만 더 나아가 a와 d를 연결할 수도 있다. 장기적으로는 B와 Z를 연결하는 방식으로 응용할 수 있을 것”이라고 말했다.

방대한 온톨로지 데이터는 악의적인 접근이나 수정이 없어야 하기에 블록체인으로 관리한다. 투명성을 확보할 수 있고 해킹 위협이 낮아지는 효과가 나타난다. 특히 온톨로지 데이터를 업데이트하는 사람에게 보상으로 코인을 지급하는 구조를 마련해 새로운 생태계를 구성할 수도 있다고 마인드AI 측은 설명했다.

지금까지 AI에 적용했던 신경망생성 기법이 틀렸다는 것은 아니다. 마인드AI 알고리즘과 상호보완적인 요소로 활용할 수 있을 것이란 전망이다.

이 대표는 “영어를 제대로 구사하려면 최소한 3000개 단어를 알아야 한다. 마찬가지로 대명제를 모아야 하는 것은 스스로 학습을 하기 위한 수준으로 가기 위해선 일정수준의 팩트를 수집해야 한다는 의미”라며 “IBM, 아마존, 구글 같은 업체들의 신경망 알고리즘이 틀렸다기보다는 서로 접근방식이 다른 것이고, 상호보완적으로 역할 할 것”이라고 말했다.

[테크M=김태환 기자(kimthin@techm.kr)]