바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

악마의 편집, 가짜 뉴스를 막아라

유권자 눈 가리는 소셜 미디어의 그늘

2017-02-20차미영 KAIST 교수

 

 

카카오톡, 트위터 등 마이크로 블로깅 플랫폼은 사용자들이 쉽게 정보를 생산, 소비, 확산시키는 주요 채널이 됐다. 하지만 이러한 플랫폼은 개인이 정보를 생산, 유통하는 정보를 검증하는 역할은 하지 않기 때문에 진실과 거짓 그리고 악성 루머가 공존하는 공간이 되기도 한다. 


지난 미국 대선에서는 ‘교황이 도널드 트럼프를 지지 선언을 했다’, ‘힐러리 클린턴이 ISIS에 무기를 팔았다’, ‘트럼프가 총투표에서도 이겼다’ 등의 가짜뉴스가 페이스북에서 48만~86만 번이나 공유됐다.

소셜미디어 공간에서는 CNN 뉴스보다 더 영향력이 큰 것으로 알려진 매셔블 헤드라인의 페이스북 공유가 평균 1만 번 이하라는 점을 감안하면, 이런 가짜뉴스의 전파가 미국 대선결과에 영향을 줬다는 주장도 전혀 틀린 말은 아니라는 생각이 들게 한다.


 가짜 뉴스 때문에 대선이 흔들렸다는 비난을 강력히 거부했던 페이스북 역시 최근에는 입장을 바꾸고 있다. 마크 저커버그 페이스북 최고경영자(CEO)는 최근 “늘어나는 증오 연설, 폭력, 가짜 뉴스에 맞서기 위해 노력할 것”이라고 선언하고 앞으로 인공지능을 활용해 허위 정보를 차단하는 방안을 마련 중이라고 한다.

 
하지만 가짜뉴스를 차단하는 것은 생각만큼 쉽지 않다. 페이스북의 랭킹 알고리즘이 사람들이 많이 호응하면 더 많이 보이도록 설계돼 있고, 가짜뉴스는 진실보다 빠른 반응을 일으키기 때문이다.


가짜 뉴스의 기승은 우리나라도 예외가 아니다. 지난해 태풍 차바로 피해가 발생하자 온라인에는 ‘현대차 태풍에 침수 차 30만 원 할인 판매’란 루머가 급속히 퍼졌다.

현대자동차가 태풍으로 침수된 차량을 일반 고객에게 30만 원 할인해 판다는 내용의 가짜뉴스였다. 사실은 침수 피해를 당한 고객이 새 차를 구입하는 경우 할인 혜택을 제공하는 것이라고 현대자동차는 해명했다.

 
 가짜 뉴스나 악성 루머를 과학적인 기법으로 해결할 수 있는 방법은 없을까? 최근 빅데이터에 기반을 둔 머신러닝 기법으로 루머를 찾아내는 방법이 KAIST(권세정, 차미영)와 서울대학교(정교민)팀의 협업을 통해 나와 세계적인 학술지인 플로스원(PLoS One)에 게재됐다. 


이 연구는 시간의 흐름에 따라 루머와 진실의 전파패턴이 달라진다는 것을 알아냈다. 또 발생초기에 루머를 구분하기 위해 어떤 관찰과 계측을 중심으로 해야 할 지에 대한 아이디어를 제공한다.

기존의 연구에 비해 월등히 짧은 3일과 최소한의 자료만으로.85%에 가까운 루머 구분력을 보이는 루머 구분 알고리즘을 소개하고 있다.

 


지속적으로 전파되는 루머


루머는 지속적으로 전파되는 경향을 보인다. 뉴스 등 일반 정보는 한 번의 광범위한 전파 이후 미디어 내에서 거의 언급되지 않지만, 루머는 길게는 수년의 긴 기간 동안 지속적으로 언급된다. 루머의 진위가 판명되기 전까지는 전파자들이 어젠다를 달성하고자 하는 의지가 작동하기 때문이다.


또 서로 연관이 없는 임의 사용자가 산발적으로 참여해 전파가 이뤄진다. 일반 정보는 온라인 내 친구관계를 통해 전파의 경로가 유추되지만 루머는 연결되지 않은 개인의 참여로 이루어지는 것이 특징이다. 또 루머는 인지도가 낮은 사용자들로부터 시작해 영향력자로 전파된다.

이같은 현상은 특히 연예나 정치 관련된 루머에서 자주 나타나는데 영향력자는 루머 전파에 참여해 그간 쌓은 신뢰를 잃지 않으려 하기 때문이다.

 


셋째로 루머는 일반 정보와 다른 언어적 특성을 보인다. 루머는 정보의 진위 여부를 의심·부정·유추하는 심리학적 과정과 연관된 단어 ‘아니다’, ‘사실일지는 모르겠지만’, ‘확실치는 않지만’, ‘내 생각에는’, ‘잘 기억나진 않지만’ 같은 단어의 사용이 월등히 높다.

이는 추후 루머가 거짓임이 밝혀질 것에 대비하는 책임회피의 언어다.
연구진은 루머가 발생한 시점으로부터 다양한 시간 간격(3~56일)을 설정해 보다 세분화된 연구를 진행했다.

그 결과 루머 초기에는 사용자와 언어적 특성이 루머 판별의 중요한 지표로 작용하고, 네트워크의 구조나 시간변화에 따른 특성은 아직 정보가 충분치 않아 유효하지 않았다. 


반면 시간이 더 흐른 뒤에는 시간이나 구조의 특성이 루머 판별의 중요한 척도로 작용한다. 이 분석을 기반으로 짧은 시간과 긴 시간 모두에서 높은 정확도를 보이는 새로운 루머 판별 알고리즘을 만들어냈다. 

 

<본 기사는 테크M 제46호(2017년 2월) 기사입니다>

 

 

뉴스