내 목소리 똑같이 흉내내는 AI컴퓨터
‘웨이브넷’이라는 이름의 이 프로젝트는 문자를 음성으로 변환하는 기존 연구가 언어 원리에 집중한 것과 달리 말의 음파를 직접 분석하는 데 초점을 맞췄다. 기존 기술은 사람의 실제 목소리를 조합해 컴퓨터 음성을 만들어냈지만 웨이브넷은 초당 1만6000개에 달하는 음파의 표본을 짜맞추는 방식을 사용한다. 이 과정에서 딥마인드가 자체 개발한 딥러닝 기술을 활용한다.
딥마인드는 “이 같은 방식을 쓰면 이론적으로 어떤 사람의 목소리도 만들어낼 수 있다”며 “사람 음성뿐 아니라 피아노와 같은 악기 소리도 인위적으로 조합할 수 있다”고 설명했다.
FT는 구글 측이 이 기술을 통해 어떤 제품이나 서비스를 내놓을지 알 수 없지만 딥마인드 연구원을 인용해 “사람이 기계와 대화하는 것은 인간과 컴퓨터 간 상호작용 분야에서 오랜 꿈”이라고 전했다.
구글은 AI 분야에서 딥마인드의 성과를 상용화한 제품을 아직 선보이지 않고 있다. AI 기술로 구글 데이터센터의 냉각 비용을 40%가량 낮췄으며 유튜브나 광고 상품 등 기존 서비스를 개선하는 데 활용 중인 것으로 알려졌다.
이호기 기자 hglee@hankyung.com
-
기사 스크랩
-
공유
-
프린트