사진=게티이미지

사진=게티이미지

“언론사 홈페이지에 왜 낯 뜨거운 포르노 사이트 광고가 있는 거죠? 누구나 보는 곳에 이런 광고가 걸려있는 게 말이 되나요?”

몇 년 전 이런 전화를 받은 적 있습니다. 홈페이지에서 기사를 보던 한 중년 독자 A씨가 홈페이지 배너 광고에 외국 포르노 사이트가 노출됐다며 깜짝 놀라 알려온 것이었죠. 화면을 갈무리한 사진까지 보내왔습니다. 담당 부서가 문제가 있는지 살펴봤지만 이 독자가 언급한 부적절한 광고는 게재된 적이 없었습니다.

독자의 컴퓨터에서 실마리를 찾을 수 있었습니다. 검색 기록을 수집한 빅데이터 기반 맞춤형 광고였던 겁니다. 따라서 A씨 컴퓨터 화면에만 문제의 광고가 걸렸죠. 홈페이지 문제는 아니었습니다. 당시만 해도 사용자 맞춤형 광고가 익숙하지 않았던 탓에 일어난 해프닝이었습니다.

이같은 빅데이터 활용은 최근 등장한 이야기는 아닙니다. 지난 2012년 뉴욕타임즈에는 미성년 자녀의 임신 사실을 유통기업을 통해 알게 된 사례가 소개된 적 있습니다. 내용은 이렇습니다. 미국 미네소타주 한 유통업체 매장에서 여고생에게 임산부용 제품 할인 쿠폰을 보냈습니다. 여고생의 아버지는 미성년자에게 왜 임산부용 쿠폰을 보냈느냐며 항의했죠. 알고보니 해당 매장은 자녀가 튼살 방지 크림과 임산부용 속옷을 검색·구입한 기록을 토대로 이 쿠폰을 맞춤형으로 제공했었던 거죠. 부모보다 빅데이터가 먼저 자녀의 임신 사실을 알았던 셈입니다.

기술은 빠르게 발전하고 있습니다. 검색 기록과 같은 텍스트 외에 위치 정보, 음성 정보 등도 수집됩니다. 이런 빅데이터를 가장 많이 보유한 곳은 안드로이드 운영체제(OS)를 보유한 구글이에요. 과거 최순실 게이트 수사 당시 박영수 특별검사팀도 안드로이드 스마트폰의 위치 기록을 활용해 비선진료 사실을 밝혀냈습니다. 구글이 수년에 걸쳐 저장한 김영재 원장의 동선에 청와대 출입 사실이 나왔던 거죠.

구글은 사용자가 음성인식 인공지능(AI)을 쓸 때도 모든 정보를 기록합니다. 사용자 동의를 한 적 없다구요? 구글은 처음 스마트폰을 사용할 때 이 정책에 동의하는 것으로 복잡한 절차를 대신하고 있습니다. 구글은 이미 당신의 음성을 녹음하고 있는 거죠.
유튜버 미첼 로우가 구글이 음성 데이터를 무단 수집해 활용한다며 올린 영상 캡처.

유튜버 미첼 로우가 구글이 음성 데이터를 무단 수집해 활용한다며 올린 영상 캡처.

일각에서는 구글이 마이크 사용도 도청한다고 주장합니다. 스마트폰 통화나 컴퓨터 마이크의 음성을 녹음해 맞춤형 광고에 활용한다는 겁니다. 유튜버 미첼 로우는 컴퓨터에서 크롬 브라우저를 실행시킨 뒤 여러 사이트를 돌아다니며 어떤 광고가 나오는지 체크했습니다. 그는 강아지 관련 광고가 없음을 확인하고는 크롬 브라우저를 종료했습니다.

이어 미첼 로우는 헤드셋 마이크를 켜고 강아지를 키우고 있으며 강아지 장난감을 사야 한다고 한참동안 말했습니다. 그가 다시 브라우저를 실행하니 여러 웹페이지에서 강아지 장난감 광고가 나오기 시작했어요. 그의 음성을 구글이 수집하고 있다는 합리적 의심이 가능한 대목입니다. 통화하면서 코딩 스터디에 대해 얘기한 뒤 해당 광고가 보이기 시작했다고 주장한 경우도 있습니다.

이처럼 빅데이터 활용 서비스는 편리하기도 하지만 프라이버시(사생활) 침해 문제를 낳습니다. 때문에 블록체인과 가상화폐(암호화폐)를 활용해 이 문제를 해결하려는 시도도 나오고 있어요. 사용자에게 데이터를 요구하는 대신 정당한 보상을 제공하자는 아이디어인데, 보상 수단이 암호화폐 지급이죠. 주문형 비디오(VOD) 스트리밍 업체 왓챠플레이가 대표적입니다. 블록체인 자회사 콘텐츠프로토콜과 사용자의 영상 시청 데이터를 수집하는 대신, 정보 제공에 동의한 사용자에게는 토큰을 제공합니다.

개인정보를 제공하기 싫다면 어떻게 해야 할까요. 현재는 정보 제공을 거부하면 됩니다. 구글의 경우 계정관리의 활동제어 메뉴에서 위치기록, 기기정보, 음성 및 오디오 활동, 유튜브 검색 기록, 유튜브 시청 기록 등의 상세한 정보를 확인하고 정보 제공을 ‘일시중지’시킬 수 있습니다. 그 대가로 구글이 제공해오던 편리한 서비스는 일부 포기해야겠죠. 또 구글은 동의를 철회하거나 기존 기록을 삭제하는 옵션은 제공하지 않고 있습니다.

앞으로의 AI 경쟁은 결국 빅데이터 싸움입니다. 질 좋은 데이터를 많이 확보하는 곳이 결국 이기게 될 겁니다. 그런 탓에 정보를 활용하는 기업이 늘어날수록 사용자 정보 제공이 일상화될 수도 있어요. 인터넷 익스플로러 같은 웹브라우저나 네이버 등 포털도 엄연한 서비스고 제공에는 비용이 발생하니까요. 무료 사용하려면 정보를 제공하라고 요구할 수 있죠.

그렇게 된다면 검색 기록, 음성 정보, 위치 정보 등 프라이버시 침해 소지가 있는 데이터를 제공하지 않는 대신 서비스 비용을 내야 할 수도 있겠지요. 맞춤형 서비스를 포기하고 비용을 감수하면서 프라이버시 보호를 선택하는 이가 더 많을지는 좀 더 두고봐야 할 듯합니다.

오세성 한경닷컴 기자 sesung@hankyung.com
기사제보 및 보도자료 open@hankyung.com

ⓒ 한경닷컴, 무단전재 및 재배포 금지