바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

보는 것이 이해하는 것...AI가 데이터 활용도 바꾼다

2017-02-27민세희 데이터 시각화 아티스트

 

새로운 창작환경이 시작됐다.

디지털 카메라가 등장하고 그래픽 소프트웨어의 대중화가 우리의 창작환경을 변화시켰던 것처럼, 창작자들이 소프트웨어를 직접 개발하는 것을 넘어 학습을 통해 진화할 수 있는 지능적 창작 세계를 만들어 낼 수 있게 됐다. 이러한 변화는 창작자들에겐 아주 특별한 경험으로 다가오고 있다.

바로 인공지능과 창작환경의 이야기다. 


창작자들은 기계학습을 통해 어떤 단계에 가중치를 두면 특별한 창작물을 만들어 낼 수 있는지, 어떤 학습 데이터가 더 흥미로운 결과물을 만들어 낼 수 있는지 등 더 많은 창작적 시도를 해볼 수 있게 됐다.

기계학습은 많은 데이터와 이를 처리할 수 있는 컴퓨팅 시스템이 지원돼야 가치를 발한다.

기계학습과 새로운 창작의 근간이 되는 데이터는 창작환경에서 지금까지 어떻게 받아들여지고 있었을까?


빅데이터 시각화를 위한 새로운 시도


스마트폰과 SNS가 힘을 받던 2010년 쯤, 빅데이터라는 개념이 등장했다.

당시만 해도 모두가 데이터만 있으면 당장이라도 대단한 무언가를 찾아낼 수 있을지도 모른다는 기대감에 들떠 있었다.

오바마 전 미국 대통령이 ‘열린 정부’를 공표하면서 정부 데이터 공개에 힘을 실었던 때도, ‘월드와이드웹’의 창시자 팀 버너스리가 데이터 공개가 가져올 우리 사회의 긍정적 영향에 대해서 사람들에게 알리려 했던 때도 그때 즈음이다. 


인류는 동굴벽과 동물뼈에 막대기를 숫자 삼아 새기던 아주 옛날부터 데이터와 함께 했다.

디지털 환경과 네트워크 환경이 발전하면서 양적, 질적으로 무한 증가하게 된 데이터는 ‘빅데이터’로 불리며 우리와 주변, 그리고 사회를 읽을 수 있는 단초로 받아들여졌다.

이렇게 많은 데이터를 보다 가깝게 받아들이기 위해서 우리에게는 해석의 도구가 필요했고, 시각화는 아주 좋은 창구가 될 것 같았다.

그래서 창작자들은 데이터를 알고 싶고, 보고 싶어 했다. 


사실과 결과를 말해주기 위해 데이터를 시각화하는 것은 아주 오래 전부터 해왔던 일이다.

다만 지금 우리가 얘기하고 있는 디지털 환경에서의 데이터 시각화는 아주 많은 양의 데이터를 모두 풀어놓고 전체를 한 번에 조망할 수 있도록 한다.

우리가 경험할 수 있는 데이터의 폭을 넓히고자 하는 점이 이전과 달라졌다. 


2007년 야후 이노베이션팀의 ‘서치 버스트 글로브(Search Burst Globe)’ 프로젝트는 전 세계에서 야후 서버에 요청하고 있는 쿼리 데이터를 3차원 환경에서 보여줌으로써 지금 전 세계의 어느 곳에서 무엇을 궁금해 하고 있는지 한 눈에 볼 수 있게 했다.

이 팀은 도시별 교통 데이터를 시각화 해 도시생활의 흐름을 읽는다던가, ‘응답 클라우드(answer cloud)’ 같이 집단지성을 보여주는 등 데이터를 경험하는 환경을 다양하게 접근했다.

 

야후 이노베이션팀의 ‘서치 버스트 글로브(Search Burst Globe)’ 프로젝트 [출처: https://vimeo.com/aaronkoblin] 


애석하게도 야후 이노베이션팀은 6개월간 운영된 후 기대만큼의 수익이 보이지 않는다는 이유로 해체됐다.

하지만 이들이 시도했던 시각화는 데이터를 보고 싶어 했던 사람들에게 영감을 줬다. 특히 3차원 환경에서 사용자가 데이터를 직접 탐험해 볼 수 있는 인터랙션은 이후에도 계속해서 사용되고 있다.


거시적 관점과 함께 실시간 데이터를 본다는 것은 지금 무슨 일이 어디서 어떻게 일어나고 있는지를 확인할 수 있는 바로미터가 된다.

유료서비스인 ‘트윗핑(tweetping)’은 트위터에 어떤 얘기가 오고 가는지, 인스타그램에는 어떤 사진들이 올라오는지를 대시보드를 통해 보여준다. 사람들은 이를 통해 트위터에서 특정 키워드의 화제성과 세밀한 정보를 볼 수 있다.

SNS 특성상 다수의 사람들이 한꺼번에 관심 있는 것들, 그리고 빨리빨리 지나가는 그들의 대화들을 가만히 보고 있노라면 현대사회의 건조하고 무의미한 관계가 보인다. 또 이렇게 많은 정보가 1초도 안되어 다른 정보에게 밀려나는, SNS의 그 짧은 생명력에 대한 쓸쓸한 생각이 들기도 한다.

 

>>>

우리 주변이 어떻게 움직이는지, 특히 기계 환경에서 어떤 데이터들이

어떤 과정으로 어디로 흘러가는지를 보는 것은 사실에 조금 더 가까워지는

경험이 될 수도 있고 인공지능 환경을 조금이나마 이해할 수 있지 않을까 한다.

 
구글의 데이터 아트팀에 있었던 아론 코블린(Aaron Koblin)은 ‘비행 패턴(flight Patterns)’에서 항공 데이터를 시각화했다.

그는 지도가 없는 하늘에서도 데이터를 통해 지도를 볼 수 있다는 것을 시사하며 데이터는 정보적으로도 미학적으로도 가치가 있음을 보여줬다. 

 

01 아론 코블린의 ‘비행 패턴(flight Patterns)’ [출처: www.aaronkoblin.com]

 

02 Automatic Sample Layout by Kyle McDonald : 딥러닝으로 분류된 사운드 데이터를 3차원 공간에 시각화 하고 사용자는 데이터를 돌려보면서 사운드를 함께 들어볼 수 있다. [출처: https://vimeo.com/135511186]


많은 데이터를 있는 그대로 보여주는 시각화는 통계와 공학의 접근법들, 현상을 분석하고 결과를 도출해 연구결과를 설득하기 위한 접근과는 달랐다.

새로운 시각화는 시각적 미학과 함께 사용자 스스로 데이터간의 관계성과 흐름을 생각할 여지를 만들어 주었다.

사람들은 이런 경험을 통해서 스스로 돌아보기도 하고, 우리가 살고 있는 도시와 사회에 대해서 한번쯤 생각해 볼 수 있었다.

이 모든 것들은 많은 데이터가, 정말 많은 데이터가 우리 손에 쥐어졌기 때문에 가능했다.


MIT 센서블 시티랩 역시 하나의 데이터를 시각화하면 이를 통해 사회의 또 다른 현상을 읽을 수 있음을 실험했다. 그들은 ‘리얼타임 로마(realTime ROME)’ 프로젝트에서 로마시민의 핸드폰 문자 사용량 데이터를 지도위에 표시했다.

이 데이터는 같은 시간, 같은 도시에서 일어난 다른 일들과 흐름을 같이 하고 있었다.

예를 들어 로마에서 월드컵 결승전이 일어났을 때 로마시민의 문자사용 흐름은 월드컵 경기 흐름과 일치했고, 마돈나 콘서트가 있었던 날의 데이터량은 콘서트의 흐름과 같은 리듬을 가지고 있었다.

 

MIT 센서블 시티랩의 ‘리얼타임 로마(realTime ROME)’ 프로젝트 [출처: http://senseable.mit.edu/realtimerome]

 

이처럼 휴대전화 문자 데이터가 사람들의 일상생활을 반영하고 있는 것은 데이터가 우리로부터 나왔기 때문이다.

데이터는 시각화를 통해 새로운 인사이트를 보여주고 계속해서 더 가치 있는 무언가를 찾아줄 것만 같았다.

데이터를 풀어놓고 보기만 해도 이렇게 놀라운 경험을 할 수 있는데, 더 많고 복잡한 데이터를 보게 된다면 우리의 삶을 더 풍부하게 해줄 수 있고 더 깊이 있는 인간으로 만들어 줄 수 있는, 그래서 자기반성적 경험을 통해 사회의 여러 부족한 면들을 바꿔 나갈 수 있는 계기가 될 것이라고 기대했다.


시각화의 한계와 새로운 가능성


그런데 무엇이 문제였을까?

우리는 데이터를 지나치게 맹신해 버린 나머지 데이터 시각화를 통해 복잡한 인간의 감정을 읽으려 했고 우리의 감정을 단정 지어버리는 오류를 범하기도 했다.

또 손에 주어진 데이터는 양적으로는 많으나 사실 무척 제한적이라는 것을 몇 번의 시행착오 후에 깨닫기도 했다.

때로는 스스로 객관화 되지 못한 상태에서 데이터를 섣부르게 시각화 해 데이터의 특정 부분만 의도적으로 두드러지게 만들기도 했다.

또 최근 연구에서는 같은 데이터지만 알고리즘에 따라 다른 결과를 도출한다는 점을 찾아내기도 했다.


데이터를 사람들에게 보여주고자 했던 이유는 데이터를 통해 세상의 다양한 면을 직시했을 때 우리 스스로 부족한 부분을 찾아내어 행동의 변화를 만들어내는 인식과 자기정화적 행동에 대한 기대 때문이다.

그런 기대가 있었기 때문에 많은 창작자들이 데이터를 보고 싶어 했고, 알고 싶어 했다.

하지만 인간은 생각보다 변화에 익숙하지 않았고, 변화를 간절히 원하지도 않았다. 그래서 데이터 시각화는 스쳐지나가는 정보 조각에 지나지 않기도 했다.

지금까지 경험하지 못했던 데이터를 보는 것은 신기했지만 그렇다고 우리 생활에 변화를 가져올 정도로 강력한 무엇이 되지는 못했던 것이다.

그러다 보니 데이터를 시각화 했던 창작자들의 시도는 시도로만 끝나기 일쑤였다.

결국 사회에서 필요한 시각화는 지금까지 해왔던 그대로, 사실과 연구 결과를 보여주는 보조 장치 이상의 역할을 하기는 어려웠다.

그렇다면 엑셀의 자동 차트 생성이 이미 필요한 역할을 다 하고 있는데, 굳이 새로운 시각화를 할 필요가 있을까?

데이터 시각화를 기능적으로만 본다면, 지금도 크게 불편하지 않은데 말이다.


그러나 인공지능, 그 중에서 기계학습의 발전은 데이터 시각화의 새로운 역할을 꾀할 수 있는 계기와 이유를 만들어줬다.

데이터를 어떻게 보여주던 간에 결국 뻔한 이야기이거나, 알아도 그만 몰라도 그만인 내용이거나, 클라이언트를 설득하기 위한 시각적 보조 장치 그 이상도 그 이하도 아니었던 비관적인 시각화의 세계에 변화가 시작된 것이다.


기계가 학습하는 과정은 우리 눈에 보이지 않는 감춰진 블랙박스다.

인공지능을 시각화하는 것은 우리의 호기심을 충족시켜줄 수 있는 꼭 필요한 영역이다.

인공지능 환경에서는 도출된 결과와 확률적 정확도에 대한 시각화만 필요한 것이 아니다. 어떤 데이터가 어느 레이어에서 얼마만큼의 가중치를 가지게 되는지, 학습 과정에 필요한 진짜 같은 가짜 데이터들은 어떻게 만들어지는지, 고차원에서 데이터의 관계성을 유지하는 저차원 시각화는 어떻게 만들 수 있는지 등 분석 결과를 전달하는 정보디자인의 역할을 넘어 데이터의 흐름과 변화를 보여줄 수 있는, 창작자들이 개입할 수 있는 틈이 생겼다. 


뿐만 아니라 기계학습에서의 시각화는 검색과 시각화가 동시에 이뤄질 수도 있다. 이 때문에 앞으로의 시각화는 인공지능과 함께 발전하지 않을까 하는 기대가 생긴다.

딥러닝이 시각화로, 그리고 시각화는 검색으로 이어지는 플랫폼을 기대할 수도 있다는 희망이 보인다.

실제로 다수의 창작자들은 기계학습 환경을 시각화하기 위해 다양한 시도들을 하고 있다. 그렇기 때문에 데이터 시각화는 여전히 매력적으로 보인다.

수많은 실수와 오류에도 불구하고 여전히 우리 주변이 어떻게 움직이는지, 특히 기계 환경에서 어떤 데이터들이 어떤 과정으로 어디로 흘러가는지를 눈으로 보는 것은 우리가 사실에 조금 더 가까워지는 경험이 될 수도 있다.

이를 통해 앞으로 점점 더 복잡해질 인공지능 환경을 조금이나마 이해할 수도 있기 때문이다.

 
아마 많은 창작자들이 인공지능 시각화에 관심을 두고 도전하는 이유는 소수의 엘리트를 제외한 다수의 사람들이 모르고 넘어갈 수밖에 없는 블랙박스의 세계, 그 내부의 이야기를 속속들이 꺼내어 사람들에게 전달하고 싶기 때문일지도 모른다.

모르는 상태로 살아가기엔 인공지능 환경이 너무나도 매력있게 궁금하기 때문이며 기계판단의 환경에서 인간이 조금 더 주체적으로 행동하려면 인공지능 시스템을 이해하고 개입 가능한 부분을 찾아내야 하기 때문이다.

인공지능 환경에서 데이터 시각화, 그리고 이를 시도하는 창작자들에게 분명한 자리매김을 기대한다. 

 

<본 기사는 테크M 제46호(2017년 2월) 기사입니다>