바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

‘안정성 보장하는 N대 1 비식별화 고려해야’

2016-08-12이원석 연세대 컴퓨터과학과 교수

 

이원석 연세대 컴퓨터과학과 교수
 

글 = 이원석 연세대 컴퓨터과학과 교수

한국은 옵트인(OPT_IN) 방식의 개인정보보호법을 채택하고 있다.

빅데이터를 이용하기 전에 이용 목적에 대한 동의를 모든 개인들에게 미리 받아야 하는 옵트인 방식은 개인정보의 오남용을 막을 수 있다.

그러나 빅데이터를 새롭게 분석할 때마다 매번 모든 개인에게 동의를 받는 것은 현실적으로 매우 어렵다.

반면, 빅데이터를 잘 활용하고 있는 미국은 내부적으로 다양한 목적과 방법으로 빅데이터를 분석해 실제 활용가치를 검증한 후 개인들의 동의를 받는 옵트아웃(OPT_OUT) 방식을 채택하고 있다.

또 미국에서 개인정보보호법을 어겼을 경우 개인의 피해 정도를 판단해 손해를 배상하는 민사소송의 대상이 되지만 우리나라에서는 동의 받지 않은 개인 식별 데이터를 유통하면 피해의 경중에 상관없이 형사 범죄로 간주된다.

이런 문제점들을 인식하고 국내 빅데이터의 이용을 활성화하기 위해 방송통신위원회는 2014년 비식별화 된 빅데이터를 개인 동의 없이도 활용할 수 있도록 하는 ‘빅데이터 개인정보보호 가이드라인’을 발표했다.

하지만 비식별화에 대한 명확한 정의나 측정방법이 없어 효과를 보지 못하고 있다.

비식별화 또는 익명화 방법은 여러 명의 개인정보를 갖고 있는 원본 데이터에서 개별 개인을 식별할 수 없도록 하는 일련의 조치를 통해 비식별 데이터를 만드는 작업이다. 비식별화 방법은 변환된 비식별 데이터의 정확성과 안전성 측면으로 평가할 수 있다.

비식별화 방법의 정확성은 비식별 데이터가 원본 데이터와 얼마나 일치하는가를 평가하는 것이다. 안정성은 비식별 데이터가 이후 다른 빅데이터와 결합돼 원본 데이터에 있는 특정 개인이 재식별 될 가능성이 어느 정도인가를 평가하는 것이다.

대부분 비식별화 방법은 원본 데이터에 있는 한 명의 개인 레코드에 대해 하나의 비식별 레코드를 만드는 1대 1 변환방식이며. KLT방법(k-익명성/l-다양성)과 이를 보완한 디프 프라이버시(Diff. Privacy) 방법이 제안됐다.

이 방법들은 원본 데이터의 한 개인과 비식별 데이터의 한 개인이 1대 1로 대응된다는 점 때문에 정확성은 좋지만 재식별 불가능성을 100% 보장할 수 없다.

한국에서는 비식별 데이터에서 단 1명이라도 재식별이 될 경우 개인의 피해 정도에 상관없이 원본 데이터를 제공한 주체가 형사입건 되므로 이 방법을 사용하는데 소극적일 수밖에 없다. 이런 문제를 해결하는 방안으로 원본 데이터에 있는 여러 명의 개인들을 추상화해 한 명의 가상개인으로 표현하는 N대 1 방식인 MAS 비식별화 방법을 고려해 볼 필요가 있다.

이 방법은 k-익명성을 보장하면서 원본 데이터에 있는 N명의 개인 레코드들을 집계해 하나의 비식별 레코드로 표현하는 방식으로 비식별화의 정확성이 상대적으로 낮지만 완전한 안정성을 보장할 수 있어 사회적 합의를 이끌어낼 수 있는 방법이다.

한국에서 비식별화를 통한 빅데이터 활용을 활성화하기 위해서는 다소 정확성이 낮더라도 사회적 합의가 수월한 안정성이 높은 N대1 방법을 이용해 빅데이터를 자유롭게 연계할 수 있는 분위기를 만드는 것이 시급하다.

개인정보의 보호와 활용이라는 두 마리 토끼를 잡을 수 있는 최적의 사회적 해결방안을 빠른 시일 내에 찾는 현명함이 우리에게 필요한 시점이다.
 

<본 기사는 테크M 제40호(2016년8월) 기사입니다>