한 문장만 입력하면 2분 만에 뚝딱…실력 좋아진 '영상AI'

해외서 각광받는 AI 서비스
동영상·음악 제작 앱 '인기'
루마AI
생성형 인공지능(AI)을 활용한 글로벌 앱 시장 지형도가 바뀌고 있다. 기존엔 이미지 제작 AI 서비스가 각광을 받았다면 영상·음악을 만들어주는 AI 서비스가 인기를 끌고 있다.

14일 글로벌 벤처캐피털(VC) 앤드리슨호로위츠(a16z)의 ‘생성 AI 소비자 앱 톱100’ 리포트에 따르면 웹 기반 생성 AI 상위 50곳 중 12곳이 반년 새 순위권에 새로 진입했다. 신규 진입한 서비스 가운데 58%가 생성 AI를 활용한 창작 도구다. 영상과 오디오 생성 AI 서비스의 인기가 높았다. 15위에 오른 루마는 텍스트 입력만으로 고품질 동영상을 생성할 수 있다. 예컨대 '강아지가 석양이 지는 해변에서 공을 쫓는다'는 문장을 입력하면 약 2분 만에, 5초 분량의 실사 영상을 생성한다. 지정된 사물, 캐릭터, 동작, 환경을 충실히 구현하면서도 유동적인 움직임과 일관된 스토리텔링을 보여준다는 평가다.

루마의 'AI 드림 머신'엔 영상을 무한 반복해 생성할 수 있는 기능도 있다. 이를 통해 광고나 소셜미디어의 밈과 같은 콘텐츠를 적은 시간과 비용으로 쉽게 제작할 수 있다.

비글은 캐나다의 AI 스타트업의 서비스인데 사용자는 캐릭터 이미지를 업로드하고 해당 이미지가 어떻게 움직여야 하는지를 상세하게 설명하는 텍스트 프롬프트를 입력할 수 있다. 또는 텍스트 프롬프트 대신 표현하고자 하는 동작을 보여주는 비디오를 프롬프트로 제공할 수 있다. 비글 AI는 'JST-1'이라는 모델을 사용, 업로드 이미지를 자동으로 짧은 비디오로 변환한다. 이는 다른 동영상 모델과는 달리, 물리학 지식을 통합해 사실적인 캐릭터 움직임과 표정을 생성한다.
반년 전 36위에서 5위로 뛴 수노는 AI로 음악을 만들 수 있게 돕는다. 텍스트 프롬프트 방식으로 음악이 드는 게 특징이다. 예컨대 ‘어두운 밤의 분위기를 담은 남성 발라드 곡을 만들어줘’라고 문장을 입력하면 작곡은 물론 가사와 목소리까지 입힌 음원이 만들어진다.

수노와 ‘작곡 AI 투톱’으로 불리는 유디오도 33위에 올랐다. 가사, 스토리, 장르 등을 텍스트로 입력하면 AI가 40초 만에 노래를 만들어준다. 구글 딥마인드 출신 연구원들이 모여 개발한 서비스다. a16z는 보고서에서 “AI로 제작한 오디오와 비디오 품질이 엄청나게 높아졌다”고 평가했다.

데이팅 AI 앱도 순위권에 등장했다. 유맥스는 이용자의 사진을 분석하고 점수를 매긴 뒤 이성에게 매력적인 사진을 만들어준다. 룩스맥스는 이용자의 목소리를 분석해 매력도를 평가한다. 리즈는 사용자가 올린 대화 스크린샷을 분석해 상대방에게 어떤 말을 해야 할지 제안한다.중국 AI 서비스도 이용자가 빠르게 늘고 있다. 틱톡 모회사 바이트댄스가 개발한 교육 플랫폼 가우스(44위), 봇 빌더 코제(45위), AI 어시스턴트 다우바오(47위) 등이 새롭게 이름을 올렸다. 상위 50개 앱 중 6개가 바이트댄스에서 만든 제품이다. 바이트댄스는 지난해 말 생성 AI 앱 개발팀 ‘플로’를 출범시키고 AI 제품 라인업을 늘리고 있다.

고은이 기자 koko@hankyung.com