바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

AI 비서 시대, ‘대화’의 본질 자문해야

2016-11-25연세대 UX랩 인지공학스퀘어(김진현,…




[테크M = 연세대 UX랩 인지공학스퀘어(김진현, 조광수)]

오로지 대화만으로 기계와 소통을 하는 장면을 우리는 SF 영화에서 심심치 않게 목격할 수 있다. 영화 ‘허(Her)’에 등장하는 사만다나 아이언맨의 인공지능 가상비서 자비스는 인간의 형체를 지니지 않았을 뿐 인간과 동일한 방식으로 대화하면서 사용자가 원하는 정보를 제공한다.

영화의 시간적 설정 때문에 왠지 먼 미래에서나 경험할 것 같았던 이 같은 장치를 우리는 ‘대화형 인터페이스’라는 이름으로 이미 주위에서 다양한 형태로 경험하고 있다. 스마트폰이나 데스크톱을 열면 손쉽게 운영체제(OS)에 내장된 가상비서 기능을 이용할 수 있고, ‘구글 홈’, ‘아마존 에코’처럼 외부 사물인터넷(IoT) 디바이스의 형태로 접하게 되는 경우도 많다.


애플의 ‘시리’나 마이크로소프트의 ‘코타나’, 아마존의 ‘알렉사’와 같은 대화형 인공지능은 유연한 이식성을 갖고 있어 어떤 형태의 디바이스와 결합하느냐에 따라 다채로운 인터페이스를 사용자에게 제공할 수 있다.


최근 가장 주목받고 있는 대화형 인터페이스인 ‘메신저 봇’ 또한 빼놓을 수 없다. 대화형 인공지능과 텍스트 기반의 메신저 앱이 결합한 메신저 봇은, 마치 친구가 보낸 문자 메시지처럼 자연스러운 구어체를 구사하면서 사용자가 원하는 맞춤 정보를 제공한다.

친구와 약속을 잡고 있으면 메신저 봇은 약속 날짜에 맞춰 우버 서비스 예약을 제안할 수 있다. 또 그날 뭘 먹을지 이야기하면 해당 지역의 추천 레스토랑을 알려줄 수도 있다. 이런 특징 때문에 커머스 플랫폼으로서의 잠재력 또한 인정받고 있어 이를 일찍이 알아챈 기업들은 치열한 메신저 봇 시장 선점 경쟁을 펼치고 있다. 올해 초부터 이어진 페이스북의 ‘메신저 플랫폼’이나 구글 ‘알로’의 등장은 그 좋은 예다.


이렇듯 대화형 인터페이스 시장은 세계 기업들의 관심을 한 몸에 받는 분야로 성장하고 있다. 그렇다면 대화형 인터페이스의 어떤 점에 세상은 이토록 주목하는 것일까. 그 비밀은 ‘대화’라는 인간의 아주 오래된 의사소통 방식에서 찾을 수 있다.



페이스북 메신저 플랫폼. 메신저 앱에서의 일상적 대화만으로 쇼핑, 배송확인, 결제 등의 절차가 가능해진다.
(페이스북 메신저 플랫폼. 메신저 앱에서의 일상적 대화만으로 쇼핑, 배송확인, 결제 등의 절차가 가능해진다.)





가장 합리적인 의사소통 방식 ‘대화’


대화란 인간의 언어활동 가운데 가장 기본이 되는 의사소통 수단으로, 두 사람 이상의 참여자가 서로 화자와 청자 역할을 번갈아가면서(순서 교대) 집약적으로 상호작용을 하는 것을 의미한다.

대화는 자신의 의사를 간단한 표현으로 전달하고자 하는 경제성의 원리와 상대방이 정확하고 쉽게 이해할 수 있게 전달하고자 하는 구별성의 원리를 바탕으로 이뤄지기 때문에 다른 의사소통 방식보다 간결하고 합리적인 성격을 띤다.


대화의 순서 교대에는 일반적으로 대응 쌍(adjacency pair)이라고 하는 형태의 상호작용이 만들어진다. 대응 쌍이란 특정 질문에 대한 대답, 요청에 대한 행동 등등 일상적으로 대화에서 나타나는 묵시적인 규칙들을 말한다.

화자가 ‘안녕’이라고 인사하면 청자도 너무나 당연하게 ‘안녕’이라는 인사로 답하는 것은 대응 쌍의 대표적인 일례이다. 인간은 대화의 기본 구조와도 같은 이 대응 쌍들을 조합하여 상황에 맞게 적절한 대화 행위를 수행할 수 있다.


대화형 인터페이스는 이와 같은 대화의 합리적인 구조를 그대로 담아내 사용자에게 인간과의 상호작용과 가장 흡사한 사용자 경험을 제공한다. 갑자기 내일 날씨를 알고 싶어졌다고 가정하자.

기존 인터페이스를 통해서라면 날씨 앱을 다운받고 앱을 실행해 내일 날씨 섹션을 확인해야만 하지만 대화형 인터페이스라면 “내일 날씨 어때?” 라는 질문을 시작으로 몇 번의 순서 교대를 통한 소통만으로 “25도로 맑은 날씨에요”라는 정보를 손쉽게 얻을 수 있다.

이렇게 대화를 인터페이스로 채용하면 별도의 조작법을 익히지 않아도 평소에 뱉는 구어체 형식의 말과 문장이 곧 컴퓨터가 인식 가능한 명령어로서 작동하기 때문에 서비스의 사용 진입 장벽은 크게 낮아진다.


물론 대화가 간결하고 합리적일 수 있는 배경에는, 인간이 대화의 맥락을 이해할 수 있는 존재란 점을 간과해서는 안 된다. 대화는 철저히 맥락에 의존한다.

화자와 청자가 같이 교실 안에 있는 상황에서, 화자가 “여기 너무 덥다, 온도 낮추자”라고 말하면 청자는 이를 당연히 “교실이 너무 더우니 에어컨 온도를 낮춰야겠다”고 이해할 것이다.


교실의 직접적인 언급이나 에어컨이라는 조작 대상에 대한 언급이 일절 없었으나 인간은 시공간적인 현 맥락을 고려하여 이와 같은 이해가 가능하다. 이처럼 화자가 의도한, 혹은 기대하는 맥락을 청자가 잘 이해하고 선택해야 성공적으로 의사소통을 이끌 수 있다.


이전까지만 해도 대화의 맥락 이해를 대화형 인터페이스에 기대하기 힘든 실정이었지만, 최근 기술력은 이를 보완하기에 충분한 듯하다. 구글이 발표한 대화형 비서 구글 어시스턴트는 사용자의 구체적인 맥락을 고려해 그에 맞는 정보를 제공한다.


예를 들어 당신이 남대문에 가서 “‘이건’ 언제 세워졌어?”라고 구글 어시스턴트에게 물었다고 가정하자. 굳이 남대문이라고 구체적으로 말하지 않아도 구글 어시스턴트는 당신의 장소적 맥락을 고려해 질문을 적절하게 처리하고 그에 맞는 답변을 제공한다.

이는 인간과 대화하는 듯 한 사용자 경험을 선사하여, 사용자에게 이질감 없이 자연스러운 인터랙션 환경을 제공한다.


당연히 기술적 한계로 인해, 대화형 인터페이스는 아직 사람의 모든 언어를 이해할 수 없다. 애초에 질문을 인식하지 못하거나, 질문과는 전혀 무관한 동문서답의 대답을 듣게 되는 상황은 사용자가 대화형 인터페이스를 사용하면서 필연적으로 맞닥뜨리게 되는 순간들이다.

이런 오류 상황들에 대처하기 위해 대화형 인터페이스는 사용자의 감정 상태를 고려해 유기적인 감성적 관계를 형성하면서 섬세한 경험을 제공해야 한다.



구글 어시스턴트.  정글북이 최근 개봉한 영화의 이름임을 알아채고, 영화 리뷰 정보를 사용자에게 제공 중이다.
(구글 어시스턴트. 정글북이 최근 개봉한 영화의 이름임을 알아채고, 영화 리뷰 정보를 사용자에게 제공 중이다.)



인간에게 있어 대화의 목적에는 단순히 자신의 이익을 취하는 것뿐 아니라 상대의 체면을 배려하면서 서로의 인간관계를 원만히 유지하고자 하는 의지가 포함돼 있다. 후자의 목적을 달성하기 위해 인간은 대화에 감정 표현을 담는다.

누구나 상대에게 좋은 일이 있을 때는 기쁜 마음으로 축하하고, 그 반대의 경우에는 위로하며, 잘못을 저지르면 미안한 마음에 사과의 뜻을 내비친다.


이와 같은 감정 표현의 특징을 인간과 대화형 인터페이스 간의 인터랙션에도 고스란히 적용할 수 있을까? 실제로 많은 선행연구를 통해 실수에 대한 감정 표현을 하는 에이전트가 그렇지 않은 에이전트보다 긍정적인 인상을 주는 것으로 알려져 있다.

클라인(Klein)이라는 연구자의 논문에 따르면 인터랙션 오류 상황에서 에이전트의 진정성 있는 사과 한마디가 사용자의 좌절감을 크게 감소시킨다고 한다. 예기치 못한 상황에서 사용자의 체면을 배려하는 섬세한 감성 표현 설계가 양질의 사용자 경험을 제공할 수 있다는 것이다.


음성인식 기반의 대화형 인터페이스 상황에서는 목소리 톤과 같은 비언어적인 요소를 고려한 감정 표현이 중요해진다.

실제로 아마존은 당사의 대화형 인공지능인 알렉사가 목소리를 통해 사용자의 감정 상태를 알아내고, 그에 따라 알렉사 자신의 대화 화행을 바꿀 수 있게끔 설계 중이라고 밝힌 바 있다. 보다 유기적으로 사용자와 대화형 인터페이스가 교감하게 될 날이 머지않은 듯하다.


대화형 인터페이스의 바람은 국내에서도 거세게 불고 있다.


지난 9월, SK텔레콤은 음성인식 기반 IoT 디바이스인 ‘누구’를 출시하면서, 한국에선 최초로 대화형 AI를 탑재한 기기를 출시한 기업이 되었다. 삼성전자도 미국의 인공지능 플랫폼 개발 기업인 ‘비브랩스’를 인수하면서, 대화형 서비스 시장 진입의 신호탄을 쏘아 올렸다.


이렇게 국내 업계의 움직임이 증명하듯 앞으로 대화형 인터페이스 시장은 치열한 경쟁과 함께 눈부신 고공 행진을 이어나갈 것으로 보인다. 올해만 해도 괄목할만한 성장을 보인 분야이기에, 내년에는 어떤 양상으로 발전할지 벌써부터 세간의 기대가 크다.


그 기대에 부응하기 위해선 기술적인 완성도도 물론 중요하지만, 인간들의 대화가 지닌 요소를 얼마큼 충실하게 대화형 인터페이스로 구현했는가를 필수적으로 고려해야 할 것이다. 사용자가 대화의 대상으로서 아무런 불편함없이 마주할 수 있는 대화형 인터페이스가 국내에서도 곧 출시되기를 희망해본다.





<본 기사는 테크M 제43호(2016년11월) 기사입니다>