"이 장난감들로 동화 만들어줘"…순식간에 토이스토리 한 편 뚝딱
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
구글AI '아스트라' 체험해 보니
카메라 보며 실시간 영상대화
실제 동물과 인형 구별 가능
영어만 인식, 동문서답하기도
카메라 보며 실시간 영상대화
실제 동물과 인형 구별 가능
영어만 인식, 동문서답하기도
“어린 공룡 렉스는 커다란 은색 원반이 스쿨버스 옆으로 떨어지자 놀라지 않을 수 없었어요.”
15일(현지시간) 구글 연례 개발자 회의(I/O)에서 처음 공개된 ‘프로젝트 아스트라’ 체험 부스에서 인공지능(AI)이 창작 동화를 들려줬다. 프로젝트 아스트라는 구글의 최신 AI 모델인 제미나이를 기반으로 개발한 멀티모달 AI 어시스턴트다. 사람처럼 보고 듣고 말하면서 사용자를 도와준다. AI에 공룡 장난감, 원형 우주선, 스쿨버스 세 개의 장난감을 보여주고 “이들을 주인공으로 동화 이야기를 들려달라”고 말했다. 그러자 AI는 망설임 없이 이야기를 시작했다.
행사 이틀째인 이날 참가자들은 미국 캘리포니아 마운틴뷰 본사 옆에 있는 쇼어라인 엠피시어터의 체험 부스에서 구글의 다양한 AI 모델을 체험했다. 특히 프로젝트 아스트라 부스에는 긴 줄이 늘어섰다.
부스는 벽에 설치한 대형 스크린과 천장에서 아래 테이블을 비추는 카메라로 꾸몄다. 화면에 보라색으로 고양이를 그리자 AI는 “예쁜 고양이를 그렸구나. 잘했어”라고 말했다. 발을 추가로 그리자 “고양이에게 손이 생겼어”라고 반응했다. 카메라에 말없이 휴대폰을 올려놓아 봤다. AI는 “스타일리시한 스마트폰”이라고 말했다. 다만 어떤 브랜드의 무슨 모델인지는 파악하지 못했다.
프로젝트 아스트라는 이전 영상에 대한 기억력도 있었다. 동물 인형 세 개를 차례로 보여준 뒤 “첫 번째로 보여준 인형이 뭐였지”라고 묻자 “강아지”라고 답했다. 실제 동물이 아니라 인형이라는 점도 구별했다. 반응 속도도 자연스러운 대화가 가능한 수준이었다. 구글이 작년 말 출시한 차세대 대규모언어모델(LLM) 제미나이의 멀티모달 성능이 상당한 수준에 올라왔음을 짐작할 수 있었다.
이미지 인식 과정에서 오류가 발생하고, 사용자의 말을 제대로 못 알아듣거나 동문서답하는 경우도 있었다. 언어도 영어만 알아들었다. 전날 시연 영상에선 휴대폰을 사용했지만, 이날은 고정된 스크린과 카메라를 활용해 생생한 현실감을 느끼기엔 부족했다. 구글은 프로젝트 아스트라의 기술적 완성도를 높인 뒤 올해 하반기 출시할 예정이다.
프로젝트 아스트라는 오픈AI가 지난 13일 깜짝 발표한 ‘GPT-4o’의 대항마다. 현재는 GPT-4o가 한발 앞서 있다는 게 업계의 중평이다. 구글보다 서비스 출시 시점이 빠르고, 한국어 등 다양한 언어를 지원한다. 순다르 피차이 구글 최고경영자(CEO)는 “다른 기업의 혁신은 서로의 발전을 촉진한다. 구글은 지난 10년 동안 검색과 AI 등의 분야에서 리더십을 가져왔고, 앞으로도 그럴 것”이라고 말했다.
마운틴뷰=최진석 특파원 iskra@hankyung.com
15일(현지시간) 구글 연례 개발자 회의(I/O)에서 처음 공개된 ‘프로젝트 아스트라’ 체험 부스에서 인공지능(AI)이 창작 동화를 들려줬다. 프로젝트 아스트라는 구글의 최신 AI 모델인 제미나이를 기반으로 개발한 멀티모달 AI 어시스턴트다. 사람처럼 보고 듣고 말하면서 사용자를 도와준다. AI에 공룡 장난감, 원형 우주선, 스쿨버스 세 개의 장난감을 보여주고 “이들을 주인공으로 동화 이야기를 들려달라”고 말했다. 그러자 AI는 망설임 없이 이야기를 시작했다.
행사 이틀째인 이날 참가자들은 미국 캘리포니아 마운틴뷰 본사 옆에 있는 쇼어라인 엠피시어터의 체험 부스에서 구글의 다양한 AI 모델을 체험했다. 특히 프로젝트 아스트라 부스에는 긴 줄이 늘어섰다.
부스는 벽에 설치한 대형 스크린과 천장에서 아래 테이블을 비추는 카메라로 꾸몄다. 화면에 보라색으로 고양이를 그리자 AI는 “예쁜 고양이를 그렸구나. 잘했어”라고 말했다. 발을 추가로 그리자 “고양이에게 손이 생겼어”라고 반응했다. 카메라에 말없이 휴대폰을 올려놓아 봤다. AI는 “스타일리시한 스마트폰”이라고 말했다. 다만 어떤 브랜드의 무슨 모델인지는 파악하지 못했다.
프로젝트 아스트라는 이전 영상에 대한 기억력도 있었다. 동물 인형 세 개를 차례로 보여준 뒤 “첫 번째로 보여준 인형이 뭐였지”라고 묻자 “강아지”라고 답했다. 실제 동물이 아니라 인형이라는 점도 구별했다. 반응 속도도 자연스러운 대화가 가능한 수준이었다. 구글이 작년 말 출시한 차세대 대규모언어모델(LLM) 제미나이의 멀티모달 성능이 상당한 수준에 올라왔음을 짐작할 수 있었다.
이미지 인식 과정에서 오류가 발생하고, 사용자의 말을 제대로 못 알아듣거나 동문서답하는 경우도 있었다. 언어도 영어만 알아들었다. 전날 시연 영상에선 휴대폰을 사용했지만, 이날은 고정된 스크린과 카메라를 활용해 생생한 현실감을 느끼기엔 부족했다. 구글은 프로젝트 아스트라의 기술적 완성도를 높인 뒤 올해 하반기 출시할 예정이다.
프로젝트 아스트라는 오픈AI가 지난 13일 깜짝 발표한 ‘GPT-4o’의 대항마다. 현재는 GPT-4o가 한발 앞서 있다는 게 업계의 중평이다. 구글보다 서비스 출시 시점이 빠르고, 한국어 등 다양한 언어를 지원한다. 순다르 피차이 구글 최고경영자(CEO)는 “다른 기업의 혁신은 서로의 발전을 촉진한다. 구글은 지난 10년 동안 검색과 AI 등의 분야에서 리더십을 가져왔고, 앞으로도 그럴 것”이라고 말했다.
마운틴뷰=최진석 특파원 iskra@hankyung.com