오순영 한컴인텔리전스 최고기술책임자(아큐플라이 AI 대표)
오순영 한컴인텔리전스 최고기술책임자

오순영 한컴인텔리전스 최고기술책임자

인간이 가진 가장 본질적이고 직관적인 커뮤니케이션 도구는 단연 음성이다. 인간과 컴퓨터의 상호작용에서 가장 이상적인 인터페이스는 아직까지 음성이라고 할 수 있다. (‘아직까지’라고 언급한 이유는 뇌-컴퓨터 인터페이스(BCI)가 생각났기 때문인데 상용화 단계가 되려면 넘어야 할 산이 많으니 그냥 넘어가기로 한다)

현재 음성인식 AI를 활용한 거의 모든 서비스는 스피커, 핸드폰, 자동차 등 다양한 하드웨어를 통한 AI 비서, AI 통역, AI 상담사와 같이 사람처럼 대화하는 기능이 많이 강조돼 있다. 한컴그룹 역시 첫 AI 서비스로 AI 통역을 선보였다. 2018 평창동계올림픽대회 공식 통·번역 앱 ‘지니톡’이 그 시작이다.

이처럼 음성 기반 AI 서비스가 대중화되면서 개발사는 소음을 비롯한 다양한 외부 환경 변수의 극복, 사용자의 언어 습관 이해, 음성 사용자 경험(VUX) 설계, 음성 센서 자체 등 서비스 만족도를 높이기 위한 다양한 노력들을 한다. 재미있는 점은 사용자 역시 서비스를 제대로 이용하기 위해 말을 또박또박한다든지, 말의 속도를 조절한다든지, 말을 짧게 단문으로 하는 등 인공지능 서비스를 잘 사용하기 위해 나름의 노력을 한다는 것이다. AI 서비스 이용을 위해 사용자가 데이터 학습을 시키는 동시에 자신도 경험데이터를 통해 학습하는 셈이다.
한컴 AI 서비스의 새로운 방향성

코로나19가 길어지면서 강조되고 있는 새로운 변화의 키워드는 라이브커머스, OTT, 동영상 라이브 스트리밍 등이다. 이 키워드들이 급부상하면서 아마존과 구글, 페이스북의 라이브커머스를 비롯해 오래전 구글이 유튜브를, 아마존이 트위치를 인수한 이유까지 되짚어 보게 된다. 또한 음악, 음식, 드라마, 예능, 패션, 뷰티 등 다양한 한류 콘텐츠의 글로벌 소비 욕구가 빠르게 늘어나고 있다는 점도 주목할 만하다.

그래서 작년부터 국내외 시장의 라이브커머스, OTT, 동영상 라이브 스트리밍 서비스 등을 살피며 우리에게 필요한 경쟁력, 페인포인트, 글로벌 시장에 대한 니즈를 우선 분석했다. 이를 통해 AI 음성인식, 자연어처리, 통·번역기술 기술을 활용한 비즈니스가 가능하리라 판단했다. 한컴이 천착해온 언어, 문자에 대한 연구개발 노하우와 오랜 기간 쌓여온 업력을 바탕으로 삼았다.

그 결과 한컴그룹은 올해 AI 서비스의 방향성을 쉽고 편하게 접할 수 있는 대중적인 AI, 그리고 지난 30여 년간 우리나라의 문화, 언어 등을 위해 한컴그룹이 지속해온 여러 활동들을 녹여낼 수 있는 AI를 구현해냈다.
한컴 나루 AI 서비스 플랫폼
한컴의 한국어 기반 AI 기술 서비스 이력은 다채롭고도 두텁다. 평창동계올림픽 AI 음성인식 및 통·번역 기술 서비스, 코로나19 대응을 위해 AI콜센터 서비스 ‘한컴 AI체크25’를 가장 많은 지자체에 신속하게 서비스했던 경험들이 대표적이다. ‘최고’의 기술도 중요하지만 ‘최적’의 기술로 어떻게 필요한 서비스로 빠르게 전환하고, 효율적인 데이터 학습 프로세스를 가져갈 것인지에 대한 경쟁력을 갖추게 된 것이다.

이러한 경쟁력을 기반으로 한컴이 올해 새롭게 출시한 AI 플랫폼이 ‘나루(NARU)’다. 데이터를 기반으로 쉽게 생성하고, 테스트하고, 빠르게 서비스하는 AI를 목표로 한다. 영상 컨텐츠의 자막 생성 및 번역 기능을 제공하는 나루라이브(NARU Live), 문서를 통번역해 주는 나루독스(NARU Docs), 학습용 데이터를 관리하고, 데이터를 통해 AI 서비스를 제공하는 나루 게이트(NARU Gate)와 같은 각각의 독립적인 서비스들로 구성돼 있다. 하나의 사이클로 각 서비스들의 고도화가 이뤄지면서 서로를 개선하는 선순환 구조가 강점이다.

그리고 이 세 가지 서비스를 2021 국제인공지능대전에서 처음 소개했는데, 방송콘텐츠 제작사, 방송사, 쇼핑업체 등 다양한 분야의 많은 관계자들이 큰 관심을 보였다. 유일하게 동영상 콘텐츠 자막 및 실시간 번역 서비스를 들고 나온 한컴의 AI 주제가 흥미로웠던게 아닌가 싶다.

사전 제작된 드라마 동영상 콘텐츠를 수출하는 경우, 한국어 자막을 생성하고 번역하는 작업을 모두 수작업으로 하게 된다. 시간과 비용이 만만치 않게 드는 작업이다. 정해진 시간 안에 작업할 수 있는 양은 한정적이기 때문에 방대한 동영상 콘텐츠들을 수출하기 위한 사전 작업은 실로 어마어마하다. 이러한 과정을 한컴의 ‘나루라이브’는 높은 정확도로 자막 생성을 완성해 주고 번역까지 해준다. 관련 업체들 입장에서는 충분히 매력적인 서비스일 것이다.

사전 제작이 아닌 실시간 라이브 스트리밍 서비스나 라이브 커머스 방송도 해외 사용자들이 한류 콘텐츠 상품을 실시간으로 즐기면서 라이브로 구매할 수 있다면 쇼핑유통업계에는 새로운 시장이 열릴 수 있을 것이다. 실제 라이브 스트리밍 서비스 ‘트위치’를 보면, 각 생방송 채널의 가장 앞에 표현된 태그는 ‘언어’였다.

기술 중심적으로 AI 비즈니스를 바라보던 시기도 있었다. 최고의 AI 기술력도 분명 필요하지만, 적정 AI 기술로, 정말 필요한 서비스와 비즈니스 모델을 만들어내는 아이디어가 요즘은 더 필요한 시기인 것 같다. 누구나 쉽게 만들고 비전문가도 전문가처럼 데이터 분석을 할 수 있는 인공지능의 민주화도 이러한 AI 생태계를 좀 더 다양하고 풍성하게 만들어주리라 생각한다.

ⓒ 한경닷컴, 무단전재 및 재배포 금지