“미국 질병관리센터(CDC)는 매주 전국의 독감 환자 현황 보고서를 만듭니다. 의사들에게서 독감 환자 자료를 받아 어떤 지역에 독감이 퍼지고 있는지 파악하려는 것이죠. 이 보고서를 바탕으로 넓은 미국 대륙에서 전염병이 어떻게 퍼지는지, 어느 지역을 집중적으로 관리하면 되는지 대응 전략을 세웁니다. 자료를 모으고 분석해 통계를 내 보고서를 만드는 데까지 2주가량 걸립니다. 실시간이라고 하긴 조금 늦죠. 그렇다면 구글은 얼마나 걸릴까요.”

KAIST 경영대학 최고경영자과정(AIM) 가을학기 다섯 번째 시간. 정하웅 KAIST 물리학과 석좌교수는 ‘구글신(神)은 모든 것을 알고 있다’는 익살스런 제목으로 강의를 시작했다. 정 교수는 물리학을 전공했지만 ‘복잡계 네트워크’라는 새로운 학문 분야를 개척하고 있다.

“인터넷 검색회사인 구글이 2008년 학술지 ‘네이처’에 논문을 하나 게재합니다. 제목은 ‘검색엔진의 검색어 데이터를 사용한 독감 유행 감지’입니다. 구글은 우선 2003~2007년 사이에 출간된 CDC 독감 보고서를 활용해 독감 관련 키워드를 50개 선정했습니다. ‘해열’ ‘몸살 대처법’ 등이죠. 그리고 사람들이 이 키워드를 검색하면 독감 위험이 있다고 가정한 것입니다. 놀랍게도 검색엔진을 활용한 구글의 독감 예측은 CDC 보고서와 거의 일치하는 것으로 나타났습니다. 더구나 구글은 CDC보다 2주 일찍 ‘실시간’ 예측을 해냈습니다.”

○선거 결과까지 예측 가능

구글 이전의 대표적인 검색엔진은 ‘야후’였다. 야후는 사람들에게 익숙한 카테고리별 분류 방식을 도입해 한발 앞서 나갔다. 하지만 사람이 일일이 인터넷을 보면서 어떤 카테고리에 넣을지를 정리했기 때문에 웹페이지가 기하급수적으로 늘어나자 한계를 보이기 시작했다.

“구글은 사람들이 많이 클릭하는 웹페이지를 검색 결과에 순서대로 늘어놓는 아주 단순한 방식을 도입했습니다. 예컨대 구글에 ‘정하웅’을 치면 예전에는 학교 홈페이지에 있는 제 프로필이 가장 위에 올라왔는데, 지금은 제가 강의한 동영상이 첫 번째 줄에 뜬다고 해보죠. 그렇다면 사람들이 제 프로필보다는 제가 한 강의를 더 많이 클릭해본다는 뜻입니다. 구글 사용자가 구글이 할 일을 대신 해주고 있는 셈입니다. 그리고 구글은 가장 많이 클릭하는 웹페이지를 찾는 작업을 모두 컴퓨터에 시켰습니다.”

구글의 이런 검색 시스템은 선거 예측에도 이용할 수 있다. 검색창에 사람 이름을 쳐넣으면 검색 결과가 몇 개 나오는지 곧바로 보여주기 때문이다.

“작년 10월 서울시장 보궐선거가 있었죠. 선거 전날 밤 11시15분 구글 검색창에 박원순과 나경원 두 명의 당시 후보를 쳐봤습니다. 박원순 5480만건, 나경원 4660만건이었습니다. 다음날 선거 결과 53.4% 대 46.2%로 박 후보가 이겼습니다. 2008년 미국 대통령 선거에서도 구글 검색을 통해 버락 오바마 후보가 이긴다는 예상을 할 수 있었고요. 물론 정확한 결론을 내기 위해서는 동영상이나 뉴스 등으로 분류해서 각각의 가중치를 계산할 필요가 있긴 합니다. 하지만 무시하지 못할 결론이죠. 이런 걸 요즘 ‘빅 데이터’라고 부릅니다. 무수히 많은 자료 안에서 뭔가 알아낼 수 있다는 것이죠.”

○네트워크를 파악하라

구글이 이렇게 컴퓨터를 써서 웹페이지 간의 연결을 분석하는 검색 방식을 도입한 이유는 무엇일까. ‘네트워크의 본질을 정확하게 파악했기 때문’이라는 것이 정 교수의 분석이다. 그는 고속도로망을 표시한 지도와 항공망을 표시한 지도를 동시에 프레젠테이션 화면에 띄웠다.

“고속도로는 도시와 도시를 골고루 연결하는 네트워크죠. 한국의 제1 도시인 서울에서 제2 도시인 부산으로 가려면 중간에 대전이나 대구 등 다른 도시들을 거칩니다. ‘허브’가 없는 구조라고 할 수 있습니다. 하지만 항공망은 다르죠. 서울에서 부산으로 바로 갈 수 있습니다. 전국 모든 국내 공항들이 김포공항과 직접 연결돼 있는 구조입니다. ‘허브’가 있는 것이죠.”

정 교수는 이어 항공망을 훨씬 더 복잡하게 만들어 놓은 그래픽을 화면에 띄웠다. 정 교수가 1999년 네이처지에 발표한 ‘복잡하고 엄청난 크기를 가진 월드와이드웹(www)도 불과 19번 정도의 마우스 클릭이면 모두 연결될 수 있다’는 긴 제목의 논문에 등장하는 그림이다.

“인간관계를 보통 점(인간)과 선(관계)으로 나타내죠. 가상공간인 인터넷 웹페이지들도 똑같이 점과 선으로 나타낼 수 있을 것입니다. 하나의 웹페이지와 다른 웹페이지의 링크를 관계로 나타내는 것이죠. 세상의 모든 웹페이지는 어떻게 연결돼 있을까. 그 구조는 고속도로형일까, 항공망형일까. 컴퓨터를 활용해 조사해 보니 웹페이지의 네트워크는 ‘허브’가 있는 항공망 모형이었습니다.”

정 교수가 띄운 다음 그래픽 역시 항공망 모양이다. 월드와이드웹보다 훨씬 더 복잡하지만 역시 군데군데 허브가 보인다. “이 그림은 인터넷 통신망을 그림으로 나타낸 것입니다. 월드와이드웹이 가상 공간에서의 연결이라면, 인터넷 통신망은 실제 존재하는 것이죠. 우리가 쓰는 인터넷은 사이버 공간에서나 실제 통신망에서나 모두 허브를 가진 불균형적인 네트워크 모양이라는 것이 확인됐습니다.”

정 교수는 이 인터넷 통신망이 허브형 네트워크라는 결론을 낸 논문을 2000년 또 한 번 네이처지에 게재하는 쾌거를 이뤘다.

○성(性)관계 네트워크 역시 허브형

“다음은 섹스 네트워크입니다. 후천성 면역결핍증(AIDS) 같은 병뿐 아니라 각종 질병이 성관계를 통해 전염되지만, 사람들이 성관계를 잘 드러내지 않기 때문에 섹스 네트워크의 형태를 파악하는 것은 매우 중요한 문제입니다.”

프레드릭 릴예로스 스웨덴 스톡홀름대 사회학과 교수는 자국의 성인 4781명을 대상으로 설문조사를 한 결과 섹스 네트워크 역시 허브 형태를 띠고 있다는 것을 분석해냈다. 릴예로스 교수의 논문 역시 2001년 네이처지를 통해 전 세계에 소개됐다.

“누가 누구랑 성관계를 가졌는지는 밝히지 못했습니다. 하지만 남자든 여자든 파트너가 1000명 이상인 큰 허브가 있고 100명, 10명 등의 작은 허브들도 있다는 것은 설문조사를 통해 확인할 수 있었습니다. 이 경우는 카사노바라고 해야겠군요.”

이메일이나 전화 등을 통해 네트워크의 형태를 분석해보면 거의 모든 네트워크가 허브가 있는 항공망 형태라는 것이 정 교수의 분석이다. 이유는 ‘빈익빈 부익부’와 ‘효율성’ 때문이다. “친구가 많은 사람과 친해지면 자신에게 도움이 된다고들 생각하죠. 그러니까 친구가 많은 사람일수록 더 큰 허브가 되기 쉽습니다. 또 항공망 형태의 네트워크가 고속도로 형태보다 거치는 단계가 적기 때문에 효율적이기도 하고요. 그런 면에서 단순한 네트워크가 복잡해질수록 허브형으로 진화한다고 할 수도 있습니다.”

○허브를 잘 파악하면 새 전략 세울 수 있어

구글은 인터넷이 허브를 가진 형태의 네트워크라는 점에 주목했다. 그리고 컴퓨터를 활용해 어느 웹페이지가 허브인지 지속적으로 검색해 데이터베이스(DB)를 업데이트하고 있다. 그 결과 어떤 검색어를 넣더라도 사람들이 가장 많이 찾는 웹페이지를 보여주는 시스템을 구축할 수 있었던 것이다.

“제가 하는 복잡계라는 것은 사회, 정보통신 네트워크, 생명 현상 등 복잡하게 얽혀 있는 모든 것을 다루는 학문입니다. 새로 생긴 분야여서 전문가들도 정확한 정의는 아직 내리고 있지 못하지만요. 다만 점과 선이라는 네트워크로 설명될 수 있다는 공통점이 있습니다. 네트워크를 파악하면 할 수 있는 일이 아주 많습니다.”

네트워크는 생명 현상을 밝히는 데도 큰 역할을 할 것이란 전망이다. “유전자 구조를 분석해 인간의 생명 현상을 밝히려고 휴먼 게놈 프로젝트를 1990년대 시작했을 때만 해도 사람들은 이 프로젝트가 완성되면 모든 질병을 정복할 수 있을 것이라고 생각했습니다. 2004년 2만5000여개의 유전자를 밝혀냈지만, 아직 질병은 정복되지 않았습니다. 2만5000여개 유전자가 다른 2만5000여개 유전자와 조합하는 네트워크를 통해 생명 현상을 발현시키기 때문이죠. 유전자의 네트워크 구조를 알고 있으면 어떤 바이러스를 죽이려고 할 때 허브가 되는 단백질을 찾아내면 효과적으로 처리할 수 있습니다.”

네트워크를 파악해 업무 구조를 효율적으로 바꿀 수도 있다. HP는 직원들의 이메일 교류 현황을 분석해 자주 이메일을 주고받는 직원들끼리 조직을 구성하는 조직 개편을 하기도 했다. 피라미드식 구조에서 허브를 중심으로 하는 거미줄 형태로 바꾼 것이다.

“마케팅 역시 사람 간 네트워크에서 허브만 잘 파악하면 새로운 전략을 세울 수 있습니다. 예컨대 공짜로 시제품을 나눠준다고 합시다. 두 개를 주면서 ‘한 개는 손님 가지시고 한 개는 친구 드리세요’라고 얘기합니다. 그러면 하나는 허브에게 갈 가능성이 높겠죠. 허브는 그 제품을 써보고 다른 사람에게 소문을 낼 가능성이 아주 높습니다. 구태여 허브를 찾지 않아도 네트워크의 성질만 알면 이런 마케팅도 가능합니다.”

강현우 기자 hkang@hankyung.com