현재 인공지능(AI)은 미적분 문제를 몇 초 만에 풀 수 있지만 정작 바닥에 떨어진 펜을 잡을 때는 수십 번 헛손질을 반복하면서도 실패한다. 텍스트 데이터를 주로 학습한 AI는 물리적 공간감을 체득할 수 없어서다. 지금까지의 AI가 언어를 읽고 쓰는 데 특화돼 있다면 앞으로는 물리적 실재를 이해하는 공간지능으로 진화하고 있다.
현재 주류가 되고 있는 대규모언어모델(LLM)은 텍스트를 학습하며 언어적 인과관계를 파악한다. 하지만 월드모델은 텍스트나 이미지, 영상을 입력하면 이를 가상 세계(디지털 트윈)로 구축한다. 단순히 ‘사과를 놓으면 떨어진다’는 문장을 외우는 게 아니라 가상 세계에서 사과를 직접 떨어뜨려 보며 중력과 마찰력, 가속도를 스스로 계산해내는 식이다.
‘AI의 대모’로 불리는 페이페이 리 미국 스탠퍼드대 교수는 지난 6일(현지시간) 현 단계의 AI를 글은 잘 쓸지 몰라도 현실 세계에 대해서는 알지 못한다면서 이를 ‘어둠 속에 사는 명문장가’로 비유했다. 하지만 미래의 AI는 글만 쓰는 게 아니다. 로봇이 움직여 임무를 수행하려면 수시로 판단해야 한다. 2018년 데이비드 하와 위르겐 슈미트후버가 낸 논문의 제목 ‘월드모델(world Models)’이 이를 극복할 개념으로 여겨진다.
미래를 준비하는 글로벌 회사들은 월드모델에 사활을 걸고 있다. 현실을 시뮬레이션하고 예측하는 두뇌를 만들기 위해선 월드모델이 해결돼야 하지만, 실제로 움직이고 자율주행하는 피지컬AI가 실현 가능해지기 때문이다. 월드모델이 피지컬AI를 완성하기 위한 마지막 퍼즐이라는 얘기다.
일론 머스크의 xAI가 엔비디아 출신 핵심 인력들을 대거 영입해 ‘AI 생성 게임’을 만들겠다고 한 것도, 한화에어로스페이스가 게임회사인 크래프톤의 손을 잡은 것도 이런 맥락이다. 게임 속에 구현된 정교한 물리 법칙은 현실의 로봇을 움직일 수 있는 가장 강력한 데이터가 된다. 현실의 도로와 공장에서 사고를 내며 배우려면 막대한 비용이 들지만, 가상 세계(디지털 트윈)에서는 수만 번의 시행착오를 겪어도 무방하다.
이 같은 피지컬 AI 열풍은 국내 산업계에도 새로운 기회가 될 수 있다. 제조업 현장에서 쌓인 막대한 데이터가 월드모델을 구축하는 핵심 자원이기 때문이다. 시장조사업체 마켓츠앤드마켓츠에 따르면 피지컬AI 시장 규모는 지난해 44억4000만달러에서 2030년 230억6000만달러(약 34조3500억원)로 성장한다.