<※편집자 주 = 빅 데이터(Big Data)에 큰 관심이 쏠리고 있다.지난해 대선 때 유권자들의 표심(票心)을 읽을 실마리로 사회관계망서비스(SNS)의 방대한 데이터가 큰 주목을 받았고 산업계도 속속 고객의 마음을 읽는 수단으로 빅 데이터에 손을 대고 있다.빅 데이터는 그동안 '존재하지만 포착할 수 없었던' 사람들의 속내와 욕망을 파악하고 숨겨져 있던 흐름이나 추세를 잡아낼 수 있는 유용한 도구로 주목받고 있다.빅 데이터가 무엇이며 국내의 활용 수준은 어디까지 왔는지, 그 가능성과 한계는 무엇인지를 짚어본다.>

#. 신한카드의 모바일 전자지갑 '스마트월렛' 애플리케이션에는 '여기좋아'란 명칭의 맛집 추천 기능이 있다.

특히 '여기 좋아' 기능의 하부 메뉴 중에는 '테마 Shop'이 있는데 여기에는 'CEO맛집' '청담동며느리' 'TV맛집' '회식하기 좋은 곳' 등을 안내한다.

카드 사용자들은 이런 기능을 보면서 신용카드사가 어떻게 '청담동 며느리'로 불리는 부유층이 자주 가는 식당을 찾아낼 수 있을까 하는 질문을 던지게 되는데, 카드사는 여러 결제 정보를 조합해 이를 추려낸다.

카드사는 신세계가 청담동에서 운영하는 프리미엄 슈퍼마켓 'SSG'와 도곡동 타워팰리스 내 슈퍼마켓인 '스타슈퍼' 결제 고객을 걸러낸다.

이들 가운데 실제 거주지가 서초·강남구이거나 한남동 또는 여의도이면서 카드 사용액이 일정 수준 이상인 사람들이 '부유층'이라고 보고, 이들이 자주 가는 음식점을 추려내 청담동 며느리 맛집으로 추천한다.

'빅 데이터(Big Data)'가 화두다.

단지 정보통신기술(ICT) 업계에 국한된 얘기가 아니다.

지난해 다보스포럼(세계경제포럼ㆍWEF)에선 '2012년 떠오르는 10대 기술' 중 첫 번째 기술로 빅 데이터가 지목됐다.

또 다보스포럼은 '빅 데이터, 빅 임팩트(Big Impact):국제 발전을 위한 새로운 가능성'이란 보고서에서 "연구자들과 정책 결정자들은 이 데이터의 홍수를 실행력 있는 정보로 바꿀 수 있는 잠재력을 깨닫기 시작했다"며 "이 정보는 저소득층의 요구를 파악하고 그들에게 서비스를 제공하거나, 위기를 예측·예방하는 데 쓰일 수 있다"고 언급했다.

미국 정부도 백악관 과학기술정책실이 주도하고 6개 정부 부처가 참여하는 연 2억달러 규모의 '빅 데이터 연구개발(R&D) 이니셔티브'를 발표했다.

빅 데이터 분야의 주도권을 쥐기 위한 레이스를 시작한 것이다.

영국과 일본, 싱가포르 정부도 이 경쟁에 뛰어들었고 우리나라도 작년 11월 교육과학기술부 등 5개 정부기구 공동으로 '빅 데이터 마스터플랜'을 추진한다고 발표했다.

도대체 빅 데이터가 무엇이기에 세계 각국이 이렇게 앞다퉈 뛰어드는 것일까.

빅 데이터란 전통적인 데이터 관리 도구로는 수집, 조직화, 저장, 검색, 공유, 분석, 시각화가 어려운 방대하고 복잡한 데이터의 집합체를 이른다.

일반인들이 이해하기에 다소 어려움이 있지만 이미 빅 데이터를 활용한 기술은 이미 우리 생활 깊숙이 들어와 있다.

SK텔레콤이 제공하는 길 안내(내비게이션) 서비스인 '티맵(T Map)'이 대표적인 사례다.

위성항법장치(GPS)가 장착된 콜택시, 고속버스, 기업용 렌터카, 유류 운반차량 등이 수집한 전국 도로의 교통정보를 바탕으로 실시간으로 빠른 길을 안내하는 시스템이다.

5만여 대의 차량이 5분 단위로 알려오는 실시간 정보를 활용하니 도착 예상 시간도 상당히 정확하다.

신용카드사들이 고객 결제정보를 이용해 제작한 '맛집 안내' 애플리케이션(응용프로그램)도 우리가 이용하는 빅데이터 응용 서비스 중 하나다.

'음식맛이 좋은 식당은 다시 방문한다'는 점에 착안해 '3개월 내 재방문율' 같은 통계를 토대로 음식점을 추천하는 것이다.

카드사들은 신상품 개발에도 빅 데이터를 사용한다.

신한카드 관계자는 "주유 할인 카드의 이용 양태를 분석했더니 자신이 가진 카드로 할인을 받지 못하는 주유소에서 결제하는 경우가 의외로 많았다"며 "이를 고려해 모든 브랜드의 주유소에서 할인을 받는 카드를 내보자는 아이디어가 나왔다"고 말했다.

이 카드는 연회비가 제법 비싼데도(3만원) 지난해 30만장이나 발행됐다.

빅 데이터 기술의 최첨단을 달리는 미국은 활용 폭이 더 넓다.

우선 지난해 버락 오바마 대통령의 재선 성공에는 빅 데이터를 활용한 '맞춤형 선거 캠페인'이 큰 역할을 한 것으로 꼽힌다.

오바마 선거 캠프는 유권자 등록 명단과 정치헌금 기부 내역, 총기 허가증, 신용카드, 대출 정보, 보유 차종, 구독 신문, 아기의 기저귀 브랜드, 교회 출석 여부 등의 개인정보에 페이스북이나 구글 플러스에서 확보한 정보까지 더해 개개인에게 맞춤형 선거 운동을 했다.

이를테면 '공립학교에 다니는 아이가 있고 오바마 선거 진영에 등록했으며 유기농에 관한 트윗을 전송한 엄마'에게는 '우리가 오사마 빈 라덴을 사살했다'는 조 바이든 부통령의 메시지가 아니라 미셸 오바마 여사의 친환경 메시지를 보내는 식이다.

미국의 전직 언론학 교수 대니얼 싱커 부부와 탐사보도 전문 언론사 프로퍼블리카는 트위터와 구글을 통해 오바마 캠프에서 발송한 약 2만 통의 이메일을 모아 그 내용을 분석했다.

그 결과 이 2만여 통의 이메일에서만 800개의 메시지와 1천500가지가 넘는 '맞춤형' 메시지가 있다는 사실을 발견했다.

유권자의 성향을 담은 방대한 데이터를 정교하게 분석하고 세분화해 공략하는 '마이크로 타기팅(micro targeting)' 전략을 쓴 것이다.

또 온라인 쇼핑몰 아마존은 고객의 서적 구매 이력에 근거해 다른 추천도서를 내놓는 것으로 유명하다.

같은 책을 산 고객의 경우 관심사가 비슷하다고 보고, 그들이 공통적으로 구매한 책을 추천하는 방식이다.

검색업체 구글이 미국 질병통제예방센터(CDC)보다 일주일에서 열흘 정도나 앞서 전세계 독감 유행 상황을 짚어낼 수 있었던 것도 빅 데이터를 활용했기 때문이다.

특정 지역 주민들이 발열이나 기침 같은 감기의 징후들을 검색하는 빈도를 통해 독감 확산을 포착해낸 것이다.

구글의 자동번역 프로그램도 빅 데이터 활용 사례에 속한다.

구글은 유럽에서 사용되는 20개 언어로 작성된 문서·도서 수십억 장을 활용한 서비스로 성공을 거뒀다.

애플의 음성 인식 서비스인 '시리(Siri)'도 방대한 데이터에 기반해 질문의 맥락을 이해하고 추론해 적절한 답을 내놓는 방식이다.

스웨덴의 자동차 제조업체인 볼보는 소비자가 운전하면서 생긴 정보를 본사 분석 시스템에 자동 전송되도록 해 빅 데이터를 축적한다.

이를 통해 과거 50만대 가량 차를 판 뒤에나 알 수 있었을 차량 결함을 1천대 쯤 팔았을 때 파악할 수 있게 됐다고 한다.

삼성경제연구소 채승병 수석연구원은 '빅 데이터:산업 지각 변동의 진원' 보고서에서 "빅 데이터의 90% 이상을 차지하는 비정형 데이터에는 고객의 행태, 감정과 시장 트렌드 정보가 숨어 있다"며 "거대한 데이터를 직접 다룰 수 있게 되면서 정보의 손실과 왜곡이 줄어들고, 빠른 유통 속도 때문에 현상의 실시간 감지와 대응이 가능해진 것도 빅 데이터의 중요한 가치"라고 말했다.

(서울=연합뉴스) 기획취재팀 = sisyphe@yna.co.kr