심원섭 맥킨지 부파트너
심원섭 맥킨지 부파트너
인공지능(AI)의 확산이 데이터센터의 구조를 바꾸고 있다. 과거 데이터센터가 주로 개별 서버 성능과 범용 중앙처리장치(CPU) 중심이었다면 지금의 AI 클러스터는 수만 개의 그래픽처리장치(GPU)와 고속 네트워크를 하나의 시스템으로 묶는 방향으로 진화 중이다. 수조 개의 파라미터를 처리하는 AI 모델을 학습시키기 위해 GPU들이 교환하는 데이터의 양은 상상을 초월한다. 이때 연결의 문제는 새로운 병목을 만들어낸다.
실리콘 포토닉스, 전력 손실과 발열 줄인다
반도체 업계는 이미 한 번 큰 병목을 경험했다. GPU의 연산 속도를 메모리가 따라가지 못했다. 이를 해결하기 위해 등장한 고대역폭메모리(HBM)은 GPU와 메모리 간의 데이터 대역폭을 획기적으로 확대하면서 정체를 해소하는 듯했다. 하지만 이제 칩과 칩 사이, 서버와 서버 사이에서의 흐름이 문제가 되기 시작했다.

AI 모델이 커질수록 GPU 간 통신량은 폭발적으로 늘어난다. 그런데 기존 구리 배선을 이용한 데이터 전송은 거리가 길어질수록 에너지 손실이 커지고 발열도 심하다. AI 데이터센터에서 전력과 냉각이 중요해진 이유다.

여기서 주목받는 기술 중 하나가 ‘실리콘 포토닉스(Silicon Photonics)’다. 광학 소자와 전자 회로를 결합해 전기 신호를 빛으로 변환하는 기술로 구리 배선의 한계인 전력 손실과 발열 문제를 줄이면서 압도적인 대역폭을 제공한다.
실리콘 포토닉스 개념도
실리콘 포토닉스 개념도
글로벌 테크 기업들은 이미 상용화 경쟁에 들어갔다. 엔비디아는 AI데이터센터용 네트워크 플랫폼인 ‘Spectrum-X’에 적용하는 포토닉스 스위치를 선보였다. 초대형 GPU 클러스터를 연결하면서 기존 방식 대비 전력 효율은 약 3.5배, 신호 무결성은 60배 이상 개선한 것으로 알려졌다. 마벨(Marvell)은 세계 최초로 6.4Tbps급 3D 실리콘 포토닉스 엔진을 시연했다. 수백 개의 광학 부품을 하나의 패키지에 통합해 대역폭을 크게 확장하면서도 비트당 비용을 낮추는 데 성공했다.
앞서가는 TSMC, 엔비디아
다만 넘어야 할 기술적인 난제도 있다. 가장 널리 쓰이는 인듐인화물(InP) 기반 EML(전기흡수 변조 레이저)은 공정이 복잡해 수율이 상대적으로 낮고 비용 측면에서도 부담이 큰 편이다. 또 AI 데이터센터 수요가 급증하면서 2027년까지 고밀도 광트랜시버의 공급이 제한될 가능성도 제기된다.