UNIST, 3D 공간 '자연어 검색' 기술 개발
주경돈 울산과학기술원(UNIST) 인공지능대학원 교수팀이 사용자가 입력한 자연어로 3D 공간에서 원하는 대상을 찾아내는 ‘라이트스플랫’(LightSplat) 기술을 개발했다고 9일 밝혔다.
로봇·증강현실(AR) 기술에서는 카메라로 들어온 2D 이미지를 위치·색·투명도 정보를 담은 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다. 3D 공간 인식은 이렇게 복원된 공간에서 특정 물체의 위치와 영역을 파악하는 기술이다.
기존 기술은 의자·책상·문처럼 미리 정해진 범주 안에서만 물체를 찾을 수 있었다. 연구팀이 개발한 라이트스플랫은 ‘흰색 소파’, ’라면 위 달걀’ 같은 구체적이고 다양한 자연어 표현으로도 원하는 대상을 찾아낼 수 있다.
성능도 기존 기술을 크게 앞선다. 메모리 사용량을 기존 대비 64분의 1 수준으로 낮췄고, 3D 가우시안에 의미 정보를 연결해 자연어 검색이 가능하도록 준비하는 시간도 약 5초로 단축했다. 기존 최신 기술보다 50∼400배 빠른 속도다.
주 교수는 “사람의 말로 지시를 바로 수행하는 인간-기계 상호작용 로봇 개발은 물론, 텍스트로 대상을 즉시 지정해 편집하는 AR·VR 콘텐츠 제작과 디지털 트윈 기술 등에 폭넓게 적용할 수 있을 것”이라고 말했다.
울산=하인식 기자 hais@hankyung.com
로봇·증강현실(AR) 기술에서는 카메라로 들어온 2D 이미지를 위치·색·투명도 정보를 담은 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다. 3D 공간 인식은 이렇게 복원된 공간에서 특정 물체의 위치와 영역을 파악하는 기술이다.
기존 기술은 의자·책상·문처럼 미리 정해진 범주 안에서만 물체를 찾을 수 있었다. 연구팀이 개발한 라이트스플랫은 ‘흰색 소파’, ’라면 위 달걀’ 같은 구체적이고 다양한 자연어 표현으로도 원하는 대상을 찾아낼 수 있다.
성능도 기존 기술을 크게 앞선다. 메모리 사용량을 기존 대비 64분의 1 수준으로 낮췄고, 3D 가우시안에 의미 정보를 연결해 자연어 검색이 가능하도록 준비하는 시간도 약 5초로 단축했다. 기존 최신 기술보다 50∼400배 빠른 속도다.
주 교수는 “사람의 말로 지시를 바로 수행하는 인간-기계 상호작용 로봇 개발은 물론, 텍스트로 대상을 즉시 지정해 편집하는 AR·VR 콘텐츠 제작과 디지털 트윈 기술 등에 폭넓게 적용할 수 있을 것”이라고 말했다.
울산=하인식 기자 hais@hankyung.com