바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

페이스북이 선택한 음성인식 해결사 위트AI

2016-05-14장길수 칼럼니스트

위트에이아이가 개발자들을 대상으로 개최한 음성 인터페이스 컨퍼런스에서 알렉스 르브룬 CEO가 발표하고 있다.

(위트에이아이가 개발자들을 대상으로 개최한 음성 인터페이스 컨퍼런스에서 알렉스 르브룬 CEO가 발표하고 있다.)

애플 창업자 스티브 잡스는 아이폰에 음성비서 서비스인 ‘시리(Siri)’를 넣었다. 처음 호기심에 몇 번 이용해 보지만 자주 이용하는 기능은 아니다. 하지만 구글글래스, 웨어러블 디바이스, 가정용 온도조절기, 인공지능 로봇처럼 디바이스에 키보드가 없거나 작은 스크린 밖에 없다면 얘기는 달라진다. 음성 외에는 대안이 별로 없다.

자연어 처리기술 전문업체 위트에이아이(Wit.ai)의 창업자이자 최고경영자(CEO) 알렉스 르브룬은 자연어 처리기술이 결국 차세대 핵심기술이 될 것이라고 생각했다.

그는 2013년 윌리 블랜딘, 로렌 랜도우스키와 공동으로 위트에이아이를 설립했다. 이미 르브룬 CEO는 2002년부터 음성인식 기술 전문업체인 버츄오즈(VirtuOz)를 설립해 운영하고 있었다. 그는 이 회사를 뉴언스 커뮤니케이션에 매각하고 위트에이아이를 설립했다.

혁신적인 음성인식 API 제공

위트에이아이를 창업한 이유에 대해 그는 두 가지를 언급했다. 첫째는 애플리케이션 프로그래밍 인터페이스(API) 기반 자연어 플랫폼이라는 새로운 개념이 필요하다고 생각했다. 자판이 없는 차세대 디바이스는 음성 인터페이스가 필수적이다.

하지만 자연어 처리는 구현하기 쉽지 않은 기술이다. 차세대 애플리케이션이나 하드웨어 개발자들이 직접 자연어 처리 솔루션을 개발하려면 많은 비용과 시간이 들어간다.

하지만 위트에이아이 음성인식 API를 활용하면 현재 개발 중인 앱이나 하드웨어에 쉽게 음성 인터페이스 기능을 추가할 수 있다.

창업의 두 번째 이유는 ‘혁신’과 관련돼 있다. 버츄오즈나 뉴언스 커뮤니케이션 같은 업체가 음성인식 API 사업을 하는 것은 매우 힘들다. 통신사업자인 AT&T가 트윌로(음성 통화, VoIP, SMS 등 서비스를 API 방식으로 제공하는 업체)와 같은 혁신적인 서비스를 만들지 못하는 것과 비슷한 이유다.

AT&T가 트윌로 같은 서비스를 개발한다고 해도 조직 내에서 ’아웃사이더‘ 취급을 받기 십상이다. 르브룬은 위트에이아이가 음성인식 분야에서 트윌로나 스트라이프(온라인 결제 API 제공업체)와 같은 업체가 되는 것을 목표로 하고 있다.

위트에이아이는 기존의 버츄오즈와 달리 개방성, 분산환경, 커뮤니티 기반의 사업을 지향한다. 개발자들이 자신이 가진 데이터를 공유하는 조건으로 API를 무료로 이용할 수 있다.

위트에이아이의 자연어 처리기술은 카네기멜론대학의 ‘CMU 스핑크스’ 프로젝트를 통해 개발된 오픈소스 등 병렬로 처리되는 복수의 언어 처리 엔진을 통합했다. ‘에스크 지기(Ask Ziggy)’ 등 서비스도 자연어를 이해할 수 있는 API를 제공하지만 프로세스 엔진 통합기능을 제공하지는 않고 있었다.

위트에이아이는 머닝러신 기술을 활용해 학습능력을 배가했다는 특징을 갖고 있다. 르브룬은 위트에이아이의 솔루션을 ‘그들 위에 놓인 가상의 레이어(virtual layer on top of them)’라고 부르고 있다. 서로 다른 서비스를 엮어 하나의 옷처럼 만드는 것과 같다는 설명이다.

2013년 창업한 위트에이아이는 베타 서비스를 제공한 지 두 달 만에 입소문만으로 2000여 명의 개발자로부터 API 사용신청을 받았고, 자동차 회사, TV방송, 홈오토메이션 분야 스타트업 및 영향력 있는 몇몇 기업과 계약하는 성과를 거뒀다.


위트에이아이 커뮤니티에는 전 세계에서 2만 명에 달하는 개발자들이 가입해 있다.

 

 

(위트에이아이 커뮤니티에는 전 세계에서 2만 명에 달하는 개발자들이 가입해 있다.)

지난 3월 현재 위트에이아이 커뮤니티에는 2만 명에 달하는 개발자가 가입해 있다. 이들 커뮤니티 내 개발자는 위트에이아이가 제공하는 음성인식 API를 이용해 다양한 자연어 처리 애플리케이션과 디바이스를 개발하고 있다.

몇 가지 사례를 들어보면, 프랑스 알데바란이 개발한 휴머노이드 로봇 ‘나오(Nao)’는 사람이 “인사해라”, “일어나라”, “약속시간을 일정표에 추가해라”와 같은 음성명령을 내리면 그대로 수행한다.

‘M.A.R.A.’라는 가상 런닝 비서(virtual running assistant)서비스는 스마트폰에 음성명령을 내리면 운동하는 사람에게 현재 운동 수치를 말로 전해준다. 미국 UC버클리대학 재학생은 ‘모토360’ 스마트워치와 인텔의 소형 컴퓨터인 ‘에디슨’을 활용해 스마트워치에 “이제 잘 시간이다“라고 말하면 전등을 끄는 등 가전제품을 자동으로 제어해주는 솔루션을 개발했다.

음성으로 이용할 수 있는 맵인 ‘스피치맵(speechmap)’이라는 애플리케이션도 등장했다. 지도상에서 샌프란시스코를 보여 달라고 하면 샌프란시스코 지도를 보여주고 지도를 확대 축소할 수도 있다.


위트에이아이가 제공하는 음성인식 API를 이용해 스마트폰에 음성명령을 내리면 현재 운동 수치를 말로 전해주는 M.A.R.A. 가상 런닝 비서 서비스

 

(위트에이아이가 제공하는 음성인식 API를 이용해 스마트폰에 음성명령을 내리면 현재 운동 수치를 말로 전해주는 M.A.R.A. 가상 런닝 비서 서비스)

위트에이아이가 제공하는 음성인식 API를 이용해 음성으로 이용할 수 있는 지도 앱인 ‘스피치맵’

(위트에이아이가 제공하는 음성인식 API를 이용해 음성으로 이용할 수 있는 지도 앱인 ‘스피치맵’)

가장 정확한 음성인식 솔루션

최근 중국 최대 검색포털 바이두가 실시한 음성인식 테스트에서 애플과 마이크로소프트의 음성인식 시스템 기술을 제치고 위트에이아이의 솔루션이 훨씬 뛰어난 정확성을 보인 것으로 나타났다.

이 같은 기술력 덕분에 위트에이아이는 2014년 처음 실시한 투자 라운드에서 안드레센 호로위츠 등으로부터 300만 달러 투자 자금을 유치했다.

지난해 1월에는 페이스북이 위트에이아이를 인수했다. 인수된 직후 위트에이아이는 블로그를 통해 “우리가 다음 행보를 취하는 데 페이스북이 갖고 있는 자원과 재능이 도움을 줄 것”이라며 기대감을 나타냈다. 이와 함께 페이스북의 미션은 페이스북 가입자들에게 자연어 처리기술을 활용해 놀라운 사용자 경험을 제공하는 것이라고 강조했다.

>>>

중국 최대 검색포털 바이두가
실시한 음성인식 테스트에서
애플과 마이크로소프트의
음성인식 시스템 기술을 제치고
위트에이아이의 솔루션이 훨씬
뛰어난 정확성을 보인 것으로
나타났다.

페이스북의 위트에이아이


인수 당시 콜린 세바스쳔 로버트W.베어드앤코 수석 애널리스트는 “페이스북이 음성인식 기술을 스마트폰 앱이나 가정자동화 기기 등에 적용하면 유용한 서비스를 제공할 수 있을 것”이라는 의견을 나타냈다.

그는 또 “다양한 디바이스를 대상으로 말을 건내는 레이어를 제어할 수 있다면 페이스북이 보다 많은 사용자 데이터를 수집하는 기회를 얻을 것“이라고 지적했다.

페이스북에 인수된 이후 위트에이아이는 페이스북 메신저 서비스용 디지털 어시스턴트인 ‘M’ 개발에 참여하고 있다. 위트에이아이의 인공지능 기반 자연어 처리기술을 활용해 페이스북의 새로운 서비스를 개발하고 있는 것이다.

페이스북의 메신저뿐 아니라 다른 서비스에도 위트에이아이의 솔루션이 탑재될 수 있을 것으로 보인다. 페이스북의 검색 서비스인 ‘그래프 서치’, ‘ 왓츠앱’ 등에 인공지능 방식 음성인식 서비스를 탑재하는 것도 가능할 것이다.

하지만 인공지능 기반 자연어 처리기술은 아직 낙관하기 힘들다. 최근 텍사스 오스틴에서 열린 ‘SXSW 인터랙티브’에서 르브룬 CEO는 토론자로 나와 자연어 처리기술의 발전속도가 아직은 매우 더디다는 점을 강조했다.

시리같은 서비스들이 아직은 불안한 측면이 많고 멍청이 같다고 꼬집었다. 사람들이 복잡한 질문을 건네면 별로 쓸 만한 대답을 내놓지 못하는 상황을 지적한 것이다. 이 때문에 인공지능이 아직은 은행 솔루션 등 버티컬
마켓 용도로 제한적으로 활용되고 있다고 언급했다.

하지만 앞으로 자연어 처리 인공지능시스템의 범용성이 보장된다면 응용분야는 크게 확대될 전망이다. 인공지능 기반의 자연어 처리 솔루션의 최강자를 꿈꾸고 있는 위트에이아이가 페이스북과의 만남으로 앞으로 어떻게 변신할지 주목된다.

<본 기사는 테크M 제37호(2016년5월) 기사입니다>