입체지도 그리고 외계신호 찾고…우주 신비 푸는 빅데이터 뜬다
2000년 시작한 ‘슬론 디지털 스카이 서베이(SDSS)’는 지구에서 바라본 밤하늘의 입체 지도를 그리는 프로젝트다. 미국 뉴멕시코주 사막의 새크라멘토산 위에 자리 잡은 아파치 포인트 천문대에서 한번에 640개씩 촬영할 수 있는 지름 2.5m짜리 천체망원경으로 과학자들은 20억 광년까지 펼쳐진 은하와 별자리 등 각종 천체 이미지를 담고 있다. 지금까지 천체의 35%를 촬영했고 93만개 은하와 12만개의 퀘이사를 촬영했다. 이를 담은 데이터는 약 40테라바이트(TB=1TB는 1조 바이트)에 이른다. 이는 두꺼운 단행본 100만권에 해당하는 분량이다.

밤하늘 3분의 1은 40TB

IBM 왓슨연구소에 따르면 세계 최대 소셜네트워크서비스(SNS)인 페이스북은 사용자 7억명이 1년에 생산하는 사진과 비디오 100페타바이트(PB=1PB는 1000조 바이트) 자료를 처리한다. 1PB는 단행본으로 따지면 10억권으로, 세계 최대 도서관인 미국 의회도서관을 200개 세울 수 있는 정보량이다. 최근 우주의 실마리를 푸는 천문학에서 ‘빅데이터’ 기술이 주목받고 있다. 먼 우주에서 보내는 방대한 분량의 신호에서 쓸 만한 정보를 뽑아내는 이 기술을 통해 손에 잡히지 않을 것 같던 우주의 신비가 한 꺼풀씩 벗겨지고 있다.
입체지도 그리고 외계신호 찾고…우주 신비 푸는 빅데이터 뜬다
2022년까지 칠레에 설립되는 초대형 종관(綜觀)망원경(LSST)은 지름 8.4m짜리 대형 망원경으로 한 번에 가장 광범위한 지역을 관찰한다.

우주 대부분을 차지하는 암흑에너지와 암흑물질 연구를 비롯해 태양계 주위를 떠도는 소행성들의 띠인 카이퍼벨트, 별의 마지막 단계인 신성과 초신성 연구에 활용할 예정이다. 이렇게 생산되는 데이터는 하루 30TB로, 매일 3000만권 분량의 천문데이터가 쏟아진다. 연구진은 100PB에 이르는 방대한 정보를 쌓을 예정이다.

IT기업들도 관심

2024년부터 호주와 뉴질랜드, 남아프리카공화국에 차례로 완공될 제곱킬로미터배열(SKA) 거대 전파망원경도 천문 빅데이터 연구를 이끌게 된다. 약 3000개 전파안테나를 한데 묶어 1㎢ 집광면적을 가진 거대 망원경으로 구성된다. 우주의 탄생부터 진화, 외계 생명체 전파신호를 찾는 데 활용할 예정이다. SKA에선 매초에 700TB, 연간 130PB 규모의 자료가 생성될 전망이다. 과학계는 2020년까지 60PB의 동시 처리 능력이 필요할 것으로 예상하고 있다.

정보기술(IT)기업 입장에서도 천문학과의 연계는 손해 볼 ‘장사’가 아니다. 막대한 분량의 자료를 빠른 속도로 처리하는 신기술을 테스트할 좋은 기회다. SKA 프로젝트에 참여한 연구진은 IBM과 손을 잡았다. IBM은 우주에서 들어오는 약한 신호를 잃지 않기 위해 전파신호 소실을 막는 칩 성능을 개선하고 전력 소비를 줄인 칩 개발에 나섰다. 시스코도 데이터를 주고받는 속도를 높이기 위한 전송 기술을 제공한다.

한국 천문빅데이터 연구자 없어

천문 연구의 강국은 빅데이터 선진국이다. 미국은 2012년 버락 오바마 대통령이 ‘빅데이터 이니셔티브’를 발표한 이후 미국 항공우주국(NASA)이 나서 활용 방안을 찾기 시작했다. NASA는 행성탐사선의 탐사 기록부터 금성과 화성 등에서 수집한 데이터, 각종 기상관측위성이 수집한 기후기록 등을 연구자에게 무료로 공급하고 있다. 국내에서도 빅데이터와 연계한 천문 연구에 관심이 모아지고 있지만 데이터 공개가 늦어 연구 가치가 떨어진다는 지적이다. 올해 내 NASA가 주도하는 태양계탐사가상연구소(SSERVI)에 가입이 예정돼 있지만, 정작 제공되는 데이터를 처리할 줄 아는 전문가가 거의 없는 실정이다. 최영준 한국천문연구원 선임연구원은 “뉴호라이즌 등 각종 탐사선이 보내오는 따끈한 빅데이터를 공개하고 있지만 이를 활용하는 방법을 아는 국내 전문가가 없어 사이언스나 네이처 등 국제학술지에 논문을 쓰지 못하고 있다”고 말했다.

박근태 기자 kunta@hankyung.com