바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

외부의 데이터 활용법 찾아라

2017-05-31이영주 한국정보화진흥원 수석

 

[테크M = 이영주 한국정보화진흥원 수석] 4차 산업혁명이 제시하는 미래는 생각보다 빨리 다가오고 있다. 클라우드 컴퓨팅과 빅데이터에 대해 이제는 단순히 저비용 고효율로 데이터를 관리하는 수단으로만 인식하지 말고 조금 더 공격적이고 혁신적인 활용 전략이 요구된다.

클라우드 환경에서 빅데이터와 인공지능 기술이 결합해 시너지를 창출하기 위해서 검토해야 할 첫 번째 데이터 전략은 유연하고 개방적인 데이터 아키텍처이다. 여기서 중요한 점은 효율적 데이터 관리를 위한 ‘기술’적 관점에 한정하지 말고 ‘분석과 서비스’ 관점에서 활용 방안을 모색하는 것이다.

단순히 전사 데이터웨어하우스나 기업 내 빅데이터를 클라우드 기반으로 이동해 구축하는 것은 기술 중심의 접근법이다. 이에 비해 분석과 서비스 관점은 기업 내 정형 데이터 뿐 아니라 기업 외부의 다양한 비정형 빅데이터가 클라우드 환경에서 자유롭게 매시업(웹서비스 업체들이 제공하는 콘텐츠, 서비스를 융합해 새로운 서비스를 만들어내는 것) 되고 분석돼 비즈니스 서비스에 활용되는 것이다.

글로벌 제조업체들이 자사의 데이터와 협력사의 데이터가 클라우드 기반에서 자연스럽게 결합돼 공정을 최적화하고 새로운 물류 프로세스를 모델링하는 것이 대표적인 사례다.

두 번째 데이터 전략은 자사의 데이터를 적극적으로 개방해 인공지능과 빅데이터가 만드는 새로운 생태계를 주도하거나 기존 생태계에 참여해 네트워크 효과를 공유하는 것이다.

우리나라에서 인공지능 기반 서비스가 일상 생활에 본격적으로 확산되기 위해서는 아직 갈 길이 먼 상황이다. 제대로 된 인공지능 서비스가 개발되려면 수많은 학습용 데이터가 필요한데, 각 분야 공통적으로 한국적 상황에 특화된 학습용 데이터가 매우 부족한 상황이다.

따라서 인공지능 기반 비즈니스 생태계에 참여하기 위해서는 자사 보유 데이터를 기계학습과 서비스 접목에 필요한 기계가독형(Machine-readable) 데이터로 변환해 적극적으로 공개하고 관련 기업과의 협업을 추진할 필요가 있다. 구글, 네이버, 솔트룩스 등 인터넷 포털 기업과 빅데이터 전문기업들이 개방형 빅데이터 분석 플랫폼을 구축하고 대중에 공개하고 있는 것도 이러한 전략에 기반한 것이다.

마지막으로 고려할 사항은 빅데이터의 품질 관리에 대한 인식의 전환이다. 빅데이터 품질은 ‘정확성(exact)’ 보다는 ‘충분성(good enough)’ 개념 하에서 조직의 비즈니스 특성과 목적에 따라 관리하는 것이 바람직하다. 비정형 스트림 데이터, 센서 데이터, 고객 행동 데이터 등은 ‘대량의 데이터’이면서도 ‘정밀한 수준(Micro Level)의 데이터’이다.

대량의 데이터를 수집하는 과정에서 개별 데이터의 품질을 일일이 확인하기보다는 한 수집 과정의 예외 상황을 더욱 중점적으로 관리해야 한다. 정밀하고 미세한 데이터는 개별적인 타당성 보다 전체적인 의미와 패턴을 효율적으로 발견할 수 있는 관리 기법이 요구된다.

많은 전문가들이 데이터를 지배하는 기업이 4차 산업혁명을 지배할 것이라고 이야기한다. 21세기 새로운 원유인 데이터에서 무한한 가치를 뽑아내기 위해서는 공유와 협업, 그리고 발상의 전환이 필요한 시점이다.

 

 

<본 기사는 테크M 제49호(2017년 5월) 기사입니다>