인공지능(AI) 바둑 프로그램인 ‘알파고’를 개발한 구글 딥마인드가 사람 음성과 가까운 컴퓨터 소리를 만들고 있다고 영국 일간 파이낸셜타임스(FT)가 10일(현지시간) 보도했다.

‘웨이브넷’이라는 이름의 이 프로젝트는 문자를 음성으로 변환하는 기존 연구가 언어 원리에 집중한 것과 달리 말의 음파를 직접 분석하는 데 초점을 맞췄다. 기존 기술은 사람의 실제 목소리를 조합해 컴퓨터 음성을 만들어냈지만 웨이브넷은 초당 1만6000개에 달하는 음파의 표본을 짜맞추는 방식을 사용한다. 이 과정에서 딥마인드가 자체 개발한 딥러닝 기술을 활용한다.

딥마인드는 “이 같은 방식을 쓰면 이론적으로 어떤 사람의 목소리도 만들어낼 수 있다”며 “사람 음성뿐 아니라 피아노와 같은 악기 소리도 인위적으로 조합할 수 있다”고 설명했다.

FT는 구글 측이 이 기술을 통해 어떤 제품이나 서비스를 내놓을지 알 수 없지만 딥마인드 연구원을 인용해 “사람이 기계와 대화하는 것은 인간과 컴퓨터 간 상호작용 분야에서 오랜 꿈”이라고 전했다.

구글은 AI 분야에서 딥마인드의 성과를 상용화한 제품을 아직 선보이지 않고 있다. AI 기술로 구글 데이터센터의 냉각 비용을 40%가량 낮췄으며 유튜브나 광고 상품 등 기존 서비스를 개선하는 데 활용 중인 것으로 알려졌다.

이호기 기자 hglee@hankyung.com