SKT, 얼굴·시선까지 인식하는 AI 비서 만든다

SK텔레콤 AI 스피커 누구. SK텔레콤 제공
SK텔레콤이 음성뿐 아니라 영상, 이미지 등도 동시에 인식할 수 있는 인공지능(AI) 비서 개발에 나섰다. 집에 있는 AI 비서가 아빠, 엄마, 자녀 등 얼굴을 인식해 맞춤형 서비스를 제공하는 등 한층 똑똑한 AI 서비스가 가능해질 전망이다.

23일 통신업계에 따르면 SK텔레콤은 최근 ‘멀티모달 기반 사용자 구별 방법 및 장치’란 이름의 특허를 특허청에 출원했다. 차세대 AI 기술로 꼽히는 ‘멀티 모달 AI’ 관련 특허다. 멀티 모달 AI는 음성과 영상, 이미지 등을 동시에 인식·분석할 수 있는 AI를 말한다. 현재 대부분의 AI 스피커·AI 비서는 음성 인식만 한다. 여기에 영상·이미지 인식까지 하면 AI 비서가 ‘귀’뿐 아니라 ‘눈’까지 갖추게 돼 한층 사람 같은 AI로 진일보할 수 있다.

SK텔레콤은 신기술이 “다수의 사용자 가운데 현재 말하고 있는 사람의 얼굴을 인식하고, 이를 기반으로 맥락에 맞는 정보를 제공할 수 있다”고 설명했다. 가령 아빠와 엄마가 각각 AI 비서에게 내일 일정을 물어보면, 내가 누구인지 설명하지 않아도 두 사람에게 맞는 답을 해주게 된다. SK텔레콤은 사용자의 시선만으로 AI 비서가 휴면 상태에서 깨어나는 기술도 개발했다고 밝혔다.

SK텔레콤 관계자는 “이르면 내년 멀티모달 기술이 적용된 AI 비서를 출시할 수 있을 것”이라며 “궁극적으로는 바디 랭귀지(신체 언어)까지 이해할 수 있는 AI 비서를 만드는 게 목표”라고 했다. 사람의 의사소통의 70%는 신체 언어로 이뤄진다고 알려져 있다. AI가 신체 언어까지 이해할 수 있게 되면 사람과 훨씬 심도 깊은 의사소통을 할 수 있게 된다. SK텔레콤의 차세대 AI 원천기술 확보는 통신사를 넘어 '디지털 플랫폼 회사'로 진화하겠다는 노력의 일환이다. 같은 목표를 공유하는 KT와 LG유플러스도 첨단 정보통신(IT) 기술 확보에 속도를 내고 있다. KT는 최근 완전 자율주행차 실현을 위한 핵심 기술로 꼽히는 ‘사이드링크’ 관련 특허만 3개 출원했다. LG유플러스는 위성항법시스템(GPS) 기반 스마트팜 구현 기술, 클라우드 서버 기반 증강현실(AR) 서비스 제공 기술 등 개발에 성공했다.

서민준/선한결/배성수 기자

핫이슈