사진 : 연합뉴스
사진 : 연합뉴스
마이크로소프트(MS)가 ‘인공지능(AI) 에이전트’를 생활과 업무 곳곳에 스며들 수 있도록 관련 서비스와 제품을 대거 들고나왔다. 멀티모달 AI 시대가 본격화한 만큼 이를 보다 많은 사용자가 활용할 수 있도록 클라우드부터 PC까지 촘촘하게 배치한 것이다. 특히 올해부터 온디바이스 AI 기기가 등장하면서 이에 들어갈 ‘미니 멀티모달 AI 모델’에도 역량을 집중했다. 이에 앞서 오픈AI와 구글도 관련 AI 모델과 제품을 내놓은 만큼 점유율 경쟁이 한층 치열해질 전망이다.

◆“AI를 모든 곳에 심는다”


MS는 21일(현지시간) 워싱턴주 레드먼드에서 연례 개발자 회의 ‘빌드’를 개최했다. 사티아 나델라 MS 최고경영자(CEO)는 이날 자사의 AI 기술을 클라우드는 물론 엣지 기기까지 모든 분야에서 활용할 수 있도록 관련 기술을 대거 공개했다. MS는 먼저 애저 클라우드에서 오픈AI의 최신 AI 모델인 GPT-4o를 사용할 수 있도록 했다. GPT-4o는 오픈AI가 지난 13일 처음 공개한 멀티모달 AI 모델이다. 음성으로 대화할 수 있으며 이미지와 형상도 실시간으로 인식한다. 애저 클라우드 사용자들은 ‘애저 AI 스튜디오’에서 GPT-4o를 사용해 자사에 맞는 AI 모델을 쉽게 개발할 수 있다.

오픈AI는 “GPT-4o를 몇 주 이내에 출시할 계획”이라고 밝힌 바 있다. 이보다 먼저 MS의 애저 서비스를 통해 처음 이용할 수 있게 된 것이다. 케빈 스콧 MS 최고기술책임자(CTO)는 “오픈AI의 최신 AI 모델은 기존 모델보다 비용이 12분의 1 정도밖에 들지 않는다”고 소개했다.
코파일럿 스튜디오    자료 : MS
코파일럿 스튜디오 자료 : MS

◆“이제 AI는 가상직원”


MS는 자사의 ‘AI 비서’인 코파일럿이 이메일 모니터링, 자동화된 작업 수행, 직원 지원, 데이터 입력과 같은 단순 작업 처리 등을 할 수 있다고 밝혔다. AI 비서를 마치 가상 직원처럼 활용할 수 있다는 것이다.

또한 MS의 엣지 브라우저에서 유튜브, 링크트인, 로이터 등에 있는 영상의 음성을 번역해주는 AI 기반 실시간 비디오 번역기능도 탑재했다. MS는 “이 기능이 곧 출시될 예정”이라며 “앞으로 더 많은 언어와 비디오 플랫폼이 추가될 것”이라고 밝혔다.

MS는 ‘팀 코파일럿’도 공개했다. 코파일럿을 팀 단위로 함께 이용할 수 있는 기능이다. MS의 회의 앱인 팀즈에 탑재돼 팀원들의 회의 내용을 관리하고, 중요 정보도 요약해준다. 이 기능은 하반기 기업 고객에게 공개될 예정이다.

이와 함께 MS는 AI의 일자리 구축효과를 의식한 듯 “코파일럿이 직원의 작업을 대체하지는 않고 반복되는 일들만 대신하게 될 것”이라며 말했다.
사진 : 연합뉴스
사진 : 연합뉴스

◆‘미니 멀티모달 AI’ 승부


MS는 이날 ‘파이3’의 업그레이드 버전인 △스몰 △미디엄 △비전 등 3가지 소형 AI 모델도 공개했다. 온디바이스 AI를 위한 것으로 특히 ‘파이3 비전’에 관심이 쏠렸다. 멀티모달 기능을 갖춰 글을 읽고 그림도 인식한다. 크기가 작은 SLM 모델로 휴대전화에서 인터넷 연결 없이 자체 작동할 수 있다. MS는 “이미지 분석은 AI 기업이 추진해 온 주요 사용 사례 중 하나”라며 “휴대전화는 어디에서나 사용할 수 있는 이상적인 장소“라고 소개했다. SLM를 통해 AI의 휴대형, 개인화 현상이 짙어지는 만큼 이 시장을 적극 공략하겠다는 전략으로 풀이된다.

MS는 이와 함께 지난해 11월 공개한 자체 개발 고성능 컴퓨팅 작업용 중앙처리장치(CPU)인 '코발트 100'을 출시했다. 이날 행사에서 오픈AI의 샘 올트먼 CEO가 무대에 등장해 MS와의 협력을 강조했다. 오픈AI는 MS가 130억 달러를 투자한 최대 파트너사다. 올트먼 CEO는 ”“오늘날은 적어도 휴대전화 이후, 아마도 인터넷 이후 가장 흥미진진한 시기”라며 “이렇게 빨리 의미 있게 적용된 기술은 없을 것”이라고 말했다.

실리콘밸리=최진석 특파원 iskra@hankyung.com