바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

딥러닝, 어디에 적용되고 있나

2016-03-10백승욱 클디 대표



딥러닝은 인공신경망에 기반한 기계 학습 기술의 한 종류로 지난 몇 년간에 걸쳐 비약적인 발전을 보여주고 있다. 이러한 폭발적인 성장은 딥러닝이라는 기술이 보여주는 놀라운 성능에 기인한다. 이미지 안에 있는 물체의 종류를 알아맞히는 문제는 오랜 기간 동안 인간의 능력을 넘어서지 못했던 난제였으나 딥러닝의 도입으로 최근 들어서는 그 정확도가 95%를 넘어설 정도로 좋아져 인간의 인지능력에 준할 정도가 되었다. 이러한 딥러닝의 개념 및 성공요인은 몇 가지 키워드를 통해 설명될 수 있다. 첫 번째는 인공신경망, 두 번째는 빅데이터 및 컴퓨팅 성능의 향상, 마지막으로는 특징 학습 및 종단간 학습이다.

딥러닝은 새로운 개념이 아니다. 그 이론적인 배경은 1940년대부터 존재했으며 현재의 딥러닝을 구성하는 인공신경망도 이와 크게 다르지 않다. 다만 이러한 신경망을 다층 구조로 설계하였을 때 학습이 잘 되지 않는 문제 등으로 인한 한계로 연구의 침체기를 겪었으나 학습에 필요한 데이터를 충분히 구할 수 있고 고성능 병렬 컴퓨팅을 큰 부담 없이 이용할 수 있는 시대가 도래함에 따라 다시금 각광을 받고 있을 뿐이다.

학습 데이터가 많다는 것은 다층 구조의 인공신경망 학습에 있어 매우 중요한 역할을 한다. 기계학습 알고리즘의 목표는 주어진 데이터로부터 일반화된 지식을 추출해 내는 것인데, 학습에 필요한 데이터의 양이 적다면 일반화가 쉽지 않고 오히려 주어진 특정 데이터에만 맞춰진 과적합 문제를 야기하게 된다.

일반화 능력을 높이기 위해서는 인공신경망 층을 늘려 표현력을 키워야 하는데 이에 걸맞은 양의 데이터가 없었기 때문에 과적합 문제에 봉착해 왔던 것이다. 딥러닝 연구자들의 공로는 대량의 데이터가 있을 경우 이러한 과적합 문제가 해결되어 다층 구조의 신경망이 가지는 높은 일반화 능력을 최대한 끌어낼 수 있다는 점을 실험을 통해 보인 것이다. 여기에 고성능 컴퓨팅 환경이 더해져 몇 달씩 걸려야 실험 결과를 볼 수 있었던 것을 몇 주, 혹은 며칠 단위에 볼 수 있도록 바꾸어 연구 개발의 속도를 가속화 하는데 큰 몫을 하였다.

이렇게 촉발된 딥러닝의 발전은 특징학습과 종단간 학습이라는 개념을 확산시켜가고 있고 이에 기계학습은 새로운 국면을 맞이하고 있다. 분류를 위한 기계학습은 크게 두 가지 부분, 특징과 분류기로 구성된다. 특징은 원본 데이터로부터 패턴을 인지하기 위해 데이터를 표현하는 방법을 말하고 분류기는 특징으로 표현된 정보를 특정 기준으로 분류하는 방법을 말한다.

과거에는 특징과 분류기가 별개로 존재했다. 특히 특징은 인간이 설계하는 방식에 따라 정의되었기 때문에 실제 데이터에 존재하는 패턴을 반영하지 않는 한계가 있었다. 딥러닝은 이와 다르게 특징의 정의과정도 전적으로 주어진 학습 데이터만을 이용하여 진행, 주어진 데이터에 꼭 맞는 특징을 추출할 수 있다는 장점이 있다. 이는 특징 추출과 분류기가 하나의 인공신경망 구조로 합쳐 있고 이 시스템의 입력부와 최종 분류결과 출력부에만 정보를 주면서 학습하는 종단간 학습 방식을 사용하기 때문에 가능한 것이다.

이렇게 특징 역시 학습을 통해 정의한다는 개념이 확산되면서 전문 국제학회(International Conference on Learning Representations, ICLR)가 생겨나는 등 움직임이 일어나고 있다.



딥러닝이 기존 기계학습 알고리즘보다 획기적으로 좋은 성능을 보인다는 점이 알려지기 시작하면서 다양한 분야에 활발하게 적용되고 있다. 우선 이미지 인식의 경우 2012년 ILSVRC란 대규모 이미지 인식 대회에서 큰 성과를 보인 이후 매년 그 정확도가 개선되어 현재는 95.18%에 달하는 정확도를 달성하고 있다. 2014년에는 비디오 내용을 인식하는 알고리즘이 발표되었고 2015년에는 이미지에서 단순하게 물체 종류를 알아맞히는 것을 뛰어넘어 이미지 전체를 설명하는 문장까지도 생성해 낼 수 있는 연구 결과가 발표되었다.





음성 인식 역시 딥러닝 알고리즘이 성능을 크게 개선한 분야 중 하나이다. 대부분의 음성 인식 기술 회사들이 핵심 알고리즘을 딥러닝으로 교체한 상태이며 에러율은 5% 아래로 급감하여 Apple Siri, Samsung S-Voice, MS Cortana등의 서비스에 적용되고 있다.



문장을 이해하는 딥러닝도 발표되고 있다. 번역과 같은 응용분야가 있을 수 있는데 과거에는 형태소 분석기와 같은 세부 지식이 요구되었으나 딥러닝이 도입되면서 번역된 문장의 쌍으로 된 빅 데이터만 있으면 번역기를 만들어낼 수 있는 시대가 되었다. 이러한 방식은 Neural Machine Translation이라는 분야를 만들어 내며 확산되고 있는 추세이다.



이러한 기본적인 인식 분야에서의 탁월한 성과를 바탕으로 이제 딥러닝을 새로운 산업에 적용하려는 움직임도 일어나고 있다. 그 대표적인 예가 의료 진단 분야이다. 의료 진단이라는 행위는 환자의 증상으로부터 질병을 알아내는 것이기 때문에 딥러닝 기술이 적용되었을 때 기대할 수 있는 효용이 크다.

미국에서는 IBM이 WATSON Health라는 프로젝트를 통해 이러한 혁신을 만들어 나가고 있고 국내에서도 클디의 유방암 진단 엔진과 같은 사례가 있다. 의료영상전송시스템(PACS)와 같이 대규모 의료데이터를 제공할 수 있는 환경이 대형 병원에 구축되어 있기 때문에 딥러닝 시스템을 학습시키는 것이 가능하다.

다만 의료 분야의 특성상 그 안전성 및 효용을 입증하는데 오랜 시간이 걸릴 수 있으며 이로 인해 실제로 의료 현장에 보편적으로 적용되는 시점은 5~10년 후가 될 것으로 예상한다.




딥러닝의 산업적인 가능성이 발견된 것은 채 5년도 되지 않는다. 앞으로도 전 세계적으로 굉장히 빠른 속도로 새로운 응용 분야들이 보고될 것이며 이들은 많은 효용을 우리에게 가져다줌과 동시에 기계가 일자리를 대체하는 문제와 같은 상황들도 야기하게 될 것이다. 따라서 이 분야에 대한 경쟁력 확보를 위한 과감한 투자와 사회적 완충제에 대한 깊은 고민이 동시에 이루어져야 한다.

공동기획