카톡 먹통, 더 이상 없다 데이터센터 완전 이중화
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
데이터센터 안산 공개
재작년 판교 센터 화재로 충격
지진·홍수 등 재난대응에 총력
정신아 "연내 AI 서비스 출시"
재작년 판교 센터 화재로 충격
지진·홍수 등 재난대응에 총력
정신아 "연내 AI 서비스 출시"
“데이터센터를 만들면서 ‘이것도 이중화해요?’라는 말을 가장 많이 들었다.”
카카오는 지난 11일 경기 안산시 한양대 에리카캠퍼스 내 ‘카카오 데이터센터 안산’에서 언론 대상 행사를 열었다. 카카오 데이터센터 안산은 연면적 4만7378㎡ 규모의 하이퍼스케일 데이터센터로 총 12만 대의 서버를 보관할 수 있다. 작년 9월 데이터센터를 준공했고, 올해 1월 가동을 시작했다.
데이터센터 건립이 한창이던 2022년 10월 SK판교데이터센터 화재로 카카오 서비스 대부분이 며칠 동안 먹통이 됐다. 정신아 카카오 대표(사진)는 “우리에게는 트라우마 같은 뼈아픈 상황이었다”며 “데이터센터를 원점부터 재검토해 완공일까지 설계와 시스템을 끊임없이 보완하고 고민했다”고 말했다.
카카오는 어떤 상황에도 무중단 운영이 가능하도록 시스템을 구축했다. 전력회사로부터 전기를 공급받는 전력망부터 서버에 전기를 최종적으로 공급하기까지 전 과정과 통신회사에서 서버까지 통신을 제공하는 과정, 냉동기부터 서버실까지 냉수 공급망 등 모든 운영설비를 이중화했다. 데이터와 운영 도구 등은 이중화를 넘어 다중화 작업까지 했다. 설비 한두 곳에 문제가 생기면 백업 설비가 가동되는 구조다.
화재나 지진, 홍수, 해일, 태풍 등 각종 자연재해를 견딜 수 있는 재난 설계도 적용했다. 특히 2022년 서비스 중단 원인이 배터리 화재였던 만큼 이 부분에 심혈을 기울였다. 모든 전기 패널에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하도록 설계했다. 화재 진압이 어려운 리튬 이온 배터리 화재에 대비, 화재대응시스템을 자체 개발해 구축했다. 지진 대응을 위해 리히터 규모 6.5 이상 강진을 견딜 수 있는 성능을 갖췄다. 국내 원자력발전소 내진설계 기준에 준하는 수준이다.
카카오는 이번 데이터센터 설립의 본격적인 가동을 계기로 서비스 업그레이드에 나설 계획이다. 정 대표는 “연내 인공지능(AI)을 접목한 서비스를 내놓을 예정”이라며 “지금까지의 경쟁이 언어 모델 분야에 집중됐다면 앞으로는 의미 있는 서비스를 얼마나 잘 만드는지가 핵심이 될 것”이라고 내다봤다.
새로운 데이터센터 건립 계획도 밝혔다. 현재 부지를 찾고 있다. 정 대표는 “AI와 빅데이터 분석 등을 위한 HPC(하이퍼포먼스컴퓨팅) 데이터센터로 특화 설계할 예정”이라고 설명했다.
정 대표는 카카오가 위기 상황이던 작년 12월 대표로 내정됐다. 그는 “1~2개월 동안 문제의 근본을 파악하고 단기, 중기, 장기 쇄신 과제를 세웠다”고 설명했다. 단기 쇄신이 구조 개편이라면 장기 쇄신은 조직 프로세스와 문화까지 바꾸는 것을 포함한다. 그는 “올해 상반기는 카카오의 본질에 집중하는 방향성과 원팀으로 달릴 수 있도록 조직 구조를 개편했다”며 “하반기에는 이를 공고히 하기 위한 작업을 하게 될 것”이라고 강조했다.
안산=이승우 기자 leeswoo@hankyung.com
카카오는 지난 11일 경기 안산시 한양대 에리카캠퍼스 내 ‘카카오 데이터센터 안산’에서 언론 대상 행사를 열었다. 카카오 데이터센터 안산은 연면적 4만7378㎡ 규모의 하이퍼스케일 데이터센터로 총 12만 대의 서버를 보관할 수 있다. 작년 9월 데이터센터를 준공했고, 올해 1월 가동을 시작했다.
데이터센터 건립이 한창이던 2022년 10월 SK판교데이터센터 화재로 카카오 서비스 대부분이 며칠 동안 먹통이 됐다. 정신아 카카오 대표(사진)는 “우리에게는 트라우마 같은 뼈아픈 상황이었다”며 “데이터센터를 원점부터 재검토해 완공일까지 설계와 시스템을 끊임없이 보완하고 고민했다”고 말했다.
카카오는 어떤 상황에도 무중단 운영이 가능하도록 시스템을 구축했다. 전력회사로부터 전기를 공급받는 전력망부터 서버에 전기를 최종적으로 공급하기까지 전 과정과 통신회사에서 서버까지 통신을 제공하는 과정, 냉동기부터 서버실까지 냉수 공급망 등 모든 운영설비를 이중화했다. 데이터와 운영 도구 등은 이중화를 넘어 다중화 작업까지 했다. 설비 한두 곳에 문제가 생기면 백업 설비가 가동되는 구조다.
화재나 지진, 홍수, 해일, 태풍 등 각종 자연재해를 견딜 수 있는 재난 설계도 적용했다. 특히 2022년 서비스 중단 원인이 배터리 화재였던 만큼 이 부분에 심혈을 기울였다. 모든 전기 패널에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하도록 설계했다. 화재 진압이 어려운 리튬 이온 배터리 화재에 대비, 화재대응시스템을 자체 개발해 구축했다. 지진 대응을 위해 리히터 규모 6.5 이상 강진을 견딜 수 있는 성능을 갖췄다. 국내 원자력발전소 내진설계 기준에 준하는 수준이다.
카카오는 이번 데이터센터 설립의 본격적인 가동을 계기로 서비스 업그레이드에 나설 계획이다. 정 대표는 “연내 인공지능(AI)을 접목한 서비스를 내놓을 예정”이라며 “지금까지의 경쟁이 언어 모델 분야에 집중됐다면 앞으로는 의미 있는 서비스를 얼마나 잘 만드는지가 핵심이 될 것”이라고 내다봤다.
새로운 데이터센터 건립 계획도 밝혔다. 현재 부지를 찾고 있다. 정 대표는 “AI와 빅데이터 분석 등을 위한 HPC(하이퍼포먼스컴퓨팅) 데이터센터로 특화 설계할 예정”이라고 설명했다.
정 대표는 카카오가 위기 상황이던 작년 12월 대표로 내정됐다. 그는 “1~2개월 동안 문제의 근본을 파악하고 단기, 중기, 장기 쇄신 과제를 세웠다”고 설명했다. 단기 쇄신이 구조 개편이라면 장기 쇄신은 조직 프로세스와 문화까지 바꾸는 것을 포함한다. 그는 “올해 상반기는 카카오의 본질에 집중하는 방향성과 원팀으로 달릴 수 있도록 조직 구조를 개편했다”며 “하반기에는 이를 공고히 하기 위한 작업을 하게 될 것”이라고 강조했다.
안산=이승우 기자 leeswoo@hankyung.com