본문 바로가기
국회/정보

양날의 칼이 된 빅데이터......

by 부산중구마중물 2013. 6. 25.

 

 

 

 

 

만능 해결사냐 빅브러더냐 … 양날의 칼이 된 빅데이터

[중앙일보] 입력 2013.06.25 03:00

NSA리크스 계기 기대가 공포로

방대한 양의 사용자 정보를 기반으로 집단의 행동을 예측하는 ‘빅데이터(Big Data)’. 전 세계 기업과 정부로부터 ‘만능 해결사’처럼 각광받던 빅데이터가 최근 공포의 대상으로 바뀌고 있다. 영국 일간 가디언의 보도로 촉발된 ‘미 국가안보국(NSA) 해킹’ 논란이 정치·외교 등 전 방위로 확산되고 있기 때문이다. 영국 옥스퍼드 대학 인터넷연구소의 빅터 마예르 셴베르거 교수는 “이번 사태로 빅데이터가 시험대에 올랐다”고 말한다. ‘국가안보 vs 사생활 보호’ 문제를 넘어 빅데이터 자체에 대한 효용성 논란마저 제기된다. 허핑턴포스트는 “NSA 폭로는 빅데이터를 모으고 분석하는 것에 대한 비용과 효용에 대한 정치적 토론을 불러일으켰다”고 전했다.

 빅데이터는 ‘빅(Big)+데이터(Data)’식의 합성어만을 의미하지는 않는다. 셴베르거 교수는 “빅데이터는 적은 양의 정보에서는 알 수 없었던 것을 알게 되는 능력”이라며 “빅데이터는 우리 주위 어디에나 존재한다”고 말했다. “인터넷 포털사이트를 이용할 때 입력하는 검색어, 아이폰용 음성인식 시스템인 ‘시리’에 질문하는 것, 아마존에서 구입목록을 기반으로 새로운 책을 추천해주는 시스템 등이 모두 빅데이터”라는 것이다. 시장조사기관 가트너와 IBM 등은 Volume(데이터양)·Variety(다양한 형태)·Velocity(빠른 생성속도)의 ‘3V’를 빅데이터의 특징으로 꼽기도 한다. 수천 테라바이트의 방대하고 다양한 데이터가 빠른 속도로 생성돼 기존의 방법으로는 저장·검색·분석하기 어려운 데이터라는 뜻이다.

 이 때문에 NSA가 통화내역과 인터넷 사용내용 등 방대한 개인정보를 무작위로 수집한 것이 과연 테러 방지에 효과가 있었는지에 대한 논란도 분분하다. 포브스는 “수많은 데이터가 범죄자를 찾게 해줄 것이란 NSA의 가정은 비현실적”이라고 진단했다. 수많은 빅데이터 중에서 범죄자를 골라내고 이들의 흔적을 찾아내는 데는 엄청난 비용과 시간이 든다는 이유다. 실제로 시장조사기관 IDC의 지난해 12월 보고서에 따르면 지금까지 빅데이터는 전체 2.7제타바이트(ZB)의 0.5%밖에 분석되지 않았다. 1ZB는 1조 기가바이트(GB)로 2.7ZB는 2시간 분량의 고화질 동영상 3000억 편에 해당하는 규모다. 이 방대한 데이터는 2020년까지 2년을 주기로 두 배 이상씩 늘어날 것으로 예상된다.

통화·문자만 써도 100가지 ‘디지털 흔적’

 이처럼 빅데이터가 기업의 마케팅에 활용되거나, 테러리스트를 추적하는 데 쓰이는 등 ‘가치’를 지닌 정보가 되려면 수집과 분석이 필수다. 이 과정에서 개인정보를 대량으로 모아 파는 일명 ‘데이터브로커’도 생겼다. 파이낸셜타임스(FT)에 따르면 이들은 인터넷 검색이나 소셜네트워크서비스(SNS) 등 출처가 불분명한 여러 곳에서 개인정보 기록을 모아 판다. 질병 기록, 신용 점수부터 임산부의 출산 예정일까지 다양하다. 이런 정보들은 기업들이나 이 데이터를 재가공하는 또 다른 브로커 등에게 팔린다. 팔려 나가는 대부분의 개인 정보는 1인당 1달러(약 1100원) 미만의 헐값에 거래된다. FT는 “기업은 광범위한 고객 정보를 모으는 데 열중하고 있다”며 “고객정보산업은 이미 수백억 달러 규모로 빠르게 성장하고 있다”고 보도했다.

 
전체 0.5%만 분석망에 … 비용·효용 논란도

 문제는 이렇게 수집된 정보가 어떻게 사용될지 알 수 없다는 사실이다. 정부에 반대하는 개인이나 집단을 통제하는 무기로 쓰일 가능성도 있다. FT의 칼럼니스트 에드워드 루스는 “(NSA 파문은)아이젠하워 전 미국 대통령이 경고했던 군산복합체와 같은 문제”라며 “사회·정치·경제를 비롯해 우리 영혼에까지 큰 위협”이라고 지적했다. 당시 아이젠하워는 정부와 방위산업체가 결탁해 부당한 힘을 키웠고, 이 통제할 수 없는 힘이 민주주의를 해칠 수 있다고 경고했다. 루스 역시 “정부가 데이터를 수집해 반대 세력을 억누르는 데 사용할 수도 있다”며 우려했다. 인권단체인 일렉트로닉프런티어재단의 신디 콘은 “정부가 민간기업에 데이터를 요구한다는 사실만으로도 빅브러더라는 비판은 정당하다”고 말했다.

 하지만 빅데이터 시대에 개인정보 수집은 불가피하다는 의견도 있다. 블룸버그비즈니스위크는 “우리에게 선택권은 별로 없다”고 전했다. 이미 인터넷·휴대전화가 필수인 시대에 디지털 흔적을 남기지 않는 게 불가능하다는 것이다. 실제 온타리오 대학 기술연구소의 연구결과에 따르면 전화하고 문자를 보내는 등 기본적인 스마트폰 이용만 해도 거의 100가지 자료가 인터넷상에 남게 된다. 게다가 페이스북·트위터 같은 SNS가 활성화되면서 사진 등 개인정보를 스스로 올리는 경우도 많아졌다. 이 때문에 사람들이 개인정보 누출에 크게 개의치 않는 현상도 나타난다. 시사주간지 타임이 미국인 성인 남녀 805명을 설문한 결과 응답자의 48%는 정부가 테러 방지를 위해 통화내역, e메일 기록 등을 들여다보는 것을 ‘허용한다’고 답했다. 절반 이상(55%)은 ‘정부가 테러 방지를 위해 사생활 정보를 수집하고 있는 것을 이미 알고 있었다’고 답했다.

 실제로 빅데이터가 유용하게 쓰이는 부분도 많다. 보스턴글로브는 “NSA 폭로 이후 빅데이터의 어두운 면에만 초점이 맞춰져 있지만 장점도 많다”며 ‘긱 스쿼드(geek squad)’라는 시스템을 도시에 적용한 뉴욕시의 사례를 전했다. 뉴욕시는 수도·전기 등 도시의 각종 인프라 데이터를 수집해 분석했다. 이를 기반으로 어느 건물이 단전·화재 등에 취약한지, 어느 식당의 수도관이 자주 막히는지 등을 알아냈다. 빅데이터는 정치에서도 사용된다. 버락 오바마 미국 대통령은 지난해 재선 선거 당시 빅데이터를 활용해 승리를 거뒀다. 선거캠프의 빅데이터팀이 유권자들의 SNS, 오바마닷컴 가입 자료, 신용카드 사용내역, 구독 신문 등을 면밀히 분석해 개개인의 성향에 맞춘 선거 메시지를 보낸 게 주효했다.

“이미 활 떠나 … 좋은 목적에 쓰는 게 관건”

 빅데이터가 양면성을 지닌 만큼 논란은 불가피할 전망이다. 보스턴글로브의 파라스톡만 칼럼니스트는 “정보 수집은 이미 사방에서 벌어지고 있고 우리가 제어할 수 없게 됐다”며 “프라이버시에 관한 논의는 이미 구시대적”이라고 분석했다. 그는 대신 “어떻게 빅데이터를 선량한 목적에 쓸 수 있을 것인지에 초점이 맞춰져야 한다”고 강조했다. 타임 역시 “앞으로 NSA의 진정한 과제는 어떻게 실수를 줄이면서 빅데이터를 국가안보에 활용할 것인지가 될 것”이라고 분석했다.

채승기 기자