바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

급증하는 데이터, 제대로 관리해야 보물 된다

급변하는 IT 환경과 데이터 관리

2017-04-09강진규 기자

 

4차 산업혁명과 클라우드 컴퓨팅 확산 등 IT와 경제 환경이 급변하고 있다. 이에 따라 데이터도 급증, 기대와 우려가 함께 커지고 있다.

데이터를 효율적으로 관리하고 사용할 경우 기업의 경쟁력을 크게 높일 수 있다.

반면 급증하는 데이터의 옥석을 가리지 못하고 무분별하게 관리하거나 제대로 관리를 못해 데이터 손실을 초래할 경우 기업의 손실은 막대할 것이란 지적이다. 이에 따라 급변하는 환경 속에서 데이터 관리 문제가 더욱 중요한 이슈가 될 전망이다.

 

데이터 기반 의사결정이 생산성 높여

한국데이터진흥원이 발간한 2016 데이터산업 백서는 경제협력개발기구(OECD) 보고서를 인용, 데이터가 경제 사회에 미치는 분야를 5개 꼽았다. △신규 제품과 서비스의 생성, △공정의 최적화 및 자동화, △마케팅 개선, △새로운 조직 관리 방식 혹은 의사결정 방식의 개선, △연구개발의 개선 등이 그것이다.

맥킨지보고서에 따르면 세계적으로 교육, 교통, 소비재, 전기, 석유 에너지, 건강, 소비자 금융 7개 부문에서 개방형 데이터의 활용을 통해 매년 3조 달러의 부가가치를 생산한다. MIT는 기업이 데이터에 기반한 의사결정 방식을 채택한 경우 다른 분야에 투자를 한 경우보다 성과, 생산성이 5~10% 높았다고 발표했다.

2016 데이터산업 백서는 “데이터 주도 사회에서 비즈니스의 성공 여부는 데이터 내에서 정확한 인과 관계를 발견할 수 있는 능력에 의해 결정된다”며 “기업은 이러한 인과 관계를 이용하여 데이터를 적정하게 활용함으로써 소비자를 위한 비즈니스 전략을 수립해야 한다”고 지적했다.

데이터가 현재 경제 활동의 중요한 부분을 차지하며 이를 어떻게 활용하느냐가 기업들의 성공을 결정할 수 있다는 뜻이다.

하지만 데이터를 잘 활용하는 것은 생각만큼 쉬운 일이 아니다. IT분석기업 IDC에 따르면 전 세계에 유통되는 데이터는 2015년 8.8제타바이트(ZB)에서 2020년에는 40ZB로 증가할 것으로 예상된다. 앞서 IDC는 2008년에 전 세계에 유통되는 데이터가 0.8ZB, 2010년에는 1.2ZB라고 분석한 바 있다. 1ZB는 1조1000억 기가바이트(GB)에 해당하는 규모다. 시간이 갈수록 기하급수적으로 데이터가 증가하고 있는 것이다.

기업이 보유한 데이터도 마찬가지다. 정보 관리 솔루션기업 베리타스테크놀로지스가 수 십 억 개에 달하는 기업 데이터를 메타 데이터로 분석한 결과에 따르면 기업 데이터가 연평균 39% 늘어나고 있는 것으로 나타났다.

4차 산업혁명 시대를 맞아 데이터는 더 증가할 것으로 전망된다. 사물인터넷(IoT), 스마트공장, 드론, 자율주행차, 인공지능(AI) 등은 데이터를 활용하면서 한편으로 새로운 데이터를 창출할 것이기 때문이다.

이러한 데이터의 증가가 기업의 새로운 가치 창출에 도움을 주는 방향으로 효과적으로 관리된다면 기업은 적은 비용으로 더 나은 제품과 서비스를 만들 수 있어 비즈니스 효율성 증대에 기여할 것이다.

물론 데이터 증가를 부정적으로만 볼 수는 없다. 방대한 빅데이터에서 새로운 가치를 창출하고 더 나은 서비스를 만들고 기업들은 효율성을 높일 수 있다.

 

문제는 폭증하는 데이터가 제대로 관리되고 있지 않다는 점이다.

베리타스가 2016년 12월 공개한 ‘데이터 적체 현황 보고서’에 따르면 전 세계 기업 IT관리자의 83%가 기업에서 데이터를 무조건 저장하고 있다고 응답했다. 또 한국의 IT관리자는 88%가 무조건 저장한다고 답했다. 이 조사는 한국, 미국, 영국, 중국, 일본 등 전 세계 13개 국 1만22명의 IT 의사결정권자와 사무직 근로자를 대상으로 실시한 것이다.

또 베리타스의 데이터버그 리포트 및 데이터 게놈 지수 보고서에 따르면, 기업들은 데이터 중 54%의 비즈니스 가치를 파악 못하고 있었으며 32%는 오래되고 가치 없는 데이터인데 이를 모르고 보유하고 있다. 또 데이터의 41%는 3년간 한 번도 액세스된 적이 없다고 한다. 10페타바이트(PB) 규모의 일반적인 스토리지 환경을 가정하면 41% 데이터를 관리하는데 매년 약 2050만 달러가 들어가는 셈이 된다.

여기에 데이터가 계속 증가할 경우 기업들의 데이터 관리 비용과 리스크 역시 더 늘어날 것으로 전망이다.

무분별하게 데이터를 저장할 경우 저장, 관리 비용이 가파르게 상승해 기업 운영에 부담을 줄 수 있다.

그렇다고 제대로 선별하지 않고 데이터를 삭제하거나 관리를 소홀히 한다면 중요 데이터가 삭제돼 기업 업무와 서비스 등에 악영향을 줄 수도 있다.

데이터 관리의 또 하나의 변수는 클라우드 컴퓨팅의 확산이다. 시스코가 2016년 12월 발표한 2015∼2020 글로벌 클라우드 인덱스에 따르면 전 세계 클라우드 트래픽이 연간 기준 2015년 3.9ZB에서 2020년 14.1ZB로 3.7배 증가할 것으로 예상된다.

클라우드를 포함한 전 세계 데이터센터 트래픽은 2015년 4.7ZB에서 2020년 15.3ZB로 늘어날 것으로 전망되고 있다. 이미 데이터센터에서 클라우드 트래픽이 차지하는 비중이 적지 않은 상황인데 이같은 상황이 심화돼 2020년에는 클라우드 트래픽이 전체 데이터센터의 92%에 달할 것이라는 분석이다.

가트너 역시 지난 2017년 2월 전 세계 퍼블릭 클라우드 서비스 시장이 지난해의 2092억 달러에서 18% 성장한 2468억 달러에 이를 것으로 내다봤다. 클라우드 환경으로의 전환은 모든 IT업계가 대세로 받아들이는 추세다. 국내에서도 미래창조과학부가 클라우드 확산 전략을 추진하고 있으며 다른 정부 기관들도 클라우드 도입을 우선 고려하는 클라우드 퍼스트 정책을 시행하고 있다.

이처럼 클라우드로의 전환이 급속히 진전됨에 따라 기업과 기관들은 또 다른 고민에 직면하고 있다. 클라우드 시대에 데이터 관리를 어떻게 할 것이냐는 것.

한 기업 관계자는 “클라우드 전환에서 가장 고민되는 요인 중 하나가 데이터 관리 문제”라며 “행여나 클라우드 환경에서 데이터 유실을 우려하는 직원들이 있는 것도 사실”이라고 말했다.

결국 데이터 관리 문제를 풀지 않으면 기업들은 비용 증가로 고민하게 될 것이며 많은 데이터를 두고도 이를 제대로 활용하지 못하게 될 것이라는 지적이다. 또 무분별한 데이터 관리는 클라우드로의 전환에도 걸림돌이 돼 기업들의 경쟁력을 떨어트릴 수 있다.

 

데이터 관리의 큰 그림 필요

복잡한 환경 속에서 기업들이 어떻게 데이터를 관리할 지 큰 그림을 그려야 한다는 지적이다. 단순히 데이터를 저장해 보호하는 것을 넘어 실제 어떤 데이터가 어디에 있는지 가시성을 확보하고 이를 효율적으로 관리해야 한다는 것이다.

시스템 관점에서도 마찬가지다. 기존의 전산 장비를 운영하면서 데이터를 관리하거나 클라우드 시스템에 국한된 전략을 마련하기 보다는 하이브리드 환경, 복합적이고 다양한 환경에서의 데이터 관리, 보호 전략을 크게 갖고 있어야 한다는 지적이다.

전문가들은 성공적인 데이터 관리를 위한 핵심 조건으로 최적화된 데이터 접근, 데이터 가시성, 서비스 지속성 측면에서 접근해야 한다고 조언하고 있다.

 

>>> 4차 산업혁명 시대에 데이터는 기업에게 보물이 될 수도 있고 족쇄가 될 수도 있다.

급변하는 변화 속에서 기업이 살아남기 위해 쓸모없는 데이터가 무엇이고 중요하고

보호해야 하는 데이터가 무엇인지 분석하고 관리해야 할 시점이다.

 

김지현 베리타스 상무는 “성공적인 데이터 관리를 위해서는 파괴적 디지털 혁신(Digital Disruption)에 따른 과제를 성공적으로 해결하는 방법에 대해 고민해야 한다고 생각한다. 방치된 데이터 저장으로 인한 문제를 해결하고 데이터의 가용성을 보장할 수 있는 새로운 시각의 엔터프라이즈 데이터 관리 전략이 필요하다”며 “엔터프라이즈 데이터 관리 솔루션은 사용자가 데이터의 저장 위치에 상관없이 간편하고 안전하게 액세스 할 수 있고 데이터 생애 주기에 맞춰 데이터 저장을 제어할 수 있는 정책이 우선 마련돼야 한다”고 지적했다.

통합적인 데이터 가시성 확보와 데이터 제어도 중요하다. 김 상무는 “애플리케이션 또는 스토리지 위치에 관계없이 데이터 가시성이 확보돼야 하고 모든 데이터에 대한 액세스 권한 및 소유권을 명확하게 밝혀 주인 없는 데이터가 방치되지 않도록 리스크를 관리해야 한다”며 “국내 기업의 이기종 환경 전반에서 데이터를 상시 보호하고 쉽게 복구할 수 있으며 서비스 중단 시 신속하게 복구할 수 있는 가용성을 갖추는 것이 무엇보다 중요하다”고 설명했다.

데이터 관리에 있어서 비즈니스 연속성 보장을 위한 가용성 확보를 위해 장애 발생 시 재해 복구(Disaster Recovery) 전략을 세워야 한다. 과거 단순한 시스템이나 저용량의 데이터의 경우 전략적인 판단이 필요하지 않았지만 방대한 데이터와 시스템을 운영할 때는 전략적으로 가용성을 확보하는 것이 중요하다는 지적이다.

장애 발생 시 즉각적인 복구가 필요한 중요한 시스템과 데이터, 상대적으로 시간적 여유를 가지고 복구할 수 있는 장기 보존용 데이터 등에 대한 차별화된 관리 방안을 세워서 가용성을 확보하는 것이 비용을 최소화하면서 안정된 가용성을 보장할 수 있는 방안이라는 것이 전문가들의 조언이다.

정보 관리 솔루션 분야에서 선두를 달리고 있는 베리타스는 지난해 12월 이 같은 통합 관리를 위해 기존 백업 솔루션인 넷백업 8.0을 중심으로 360 데이터 관리 솔루션을 발표했다.

넷백업과 인포메이션 맵을 통합해 데이터가 어디에 저장되어 있고 누가 사용하고 있는지 알려주며 레질리언시 플랫폼으로 자동화되고 예측 가능한 방식으로 애플리케이션을 복구하고 재해 복구에 대비할 수 있게 지원한다.

또 벨로시티 솔루션으로 복사본을 중복 생성하지 않고 필요할 때마다 가상 복사본을 생성하게 했다. 이제는 단순히 데이터를 백업하고 관리한다는 개념을 넘어 큰 그림에서 봐야한다는 현실을 반영한 것이다.

클라우드 컴퓨팅 환경에서도 마찬가지다. 데이터 관리 때문에 클라우드 전환을 미루거나 클라우드 환경에만 초점을 맞춰 데이터 관리를 하기 보다는 전체적인 관점에서 봐야한다는 것.

김지현 상무는 “(기존 전산 시스템과 클라우드 등을) 따로따로 생각할 것이 아니라 기존 것에 추가한다는 통합 관리 관점에서 봐야 한다”며 “모든 환경에 최적화 된 데이터 접근, 데이터 가시성, 서비스 지속성 확보가 중요하다”고 설명했다.

클라우드 서비스 업체들이 데이터 관리의 중요성을 인식하고 관련 서비스를 마련했거나 마련하고 있는 만큼 이를 살펴보고 자신에게 맞는 것을 활용하는 것도 중요하다. 마이크로소프트(MS)와 아마존웹서비스(AWS), 베리타스는 지난 2월 클라우드 데이터 관리와 관련해 전략적 파트너십을 체결했다.

또 3월에는 구글이 클라우드 데이터 관리와 관련해 협력 관계를 구축했다. 클라우드 환경은 오히려 데이터 보호와 관리의 관점을 전환할 수 있는 기회가 될 수도 있다.

4차 산업혁명 시대에 데이터는 기업들에게 보물이 될 수도 있고 족쇄가 될 수도 있다는 지적이다. 급변하는 변화 속에서 기업들이 살아남기 위해 이제는 쓸모없는 데이터가 무엇이고 중요하고 보호해야 하는 데이터가 무엇인지 분석하고 관리해야 할 시점이다.

 

[테크M = 강진규 기자(viper@techm.kr)]

<본 기사는 테크M 제48호(2017년 4월) 기사입니다>