2021년 AI 비즈니스 어떻게 추진할 것인가
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
이경전 경희대 교수
세계 1위 소셜미디어 기업 페이스북은 사용자 정보를 많이 가지고 있다. 인공지능 사업도 전방위적으로 할 수 있을 것처럼 보인다. 그러나 의외로 진전된 것이 없다. 페이스북은 전세계 사람들의 개인 정보를 가장 많이 알고 있다는 점이 오히려 부담이 되고 있다. 함부로 인공지능 기반 서비스를 내놓기가 어려운 상황이다. 페이스북의 얼굴인식 기술은 미국 일리노이, 독일 함부르크 데이터 보호국 등에서 고소 및 집단 소송을 당했다. 지난 7월 일리노이에서는 8000억원가량의 합의금을 물게 됐다. 페이스북의 시가총액은 세계 10위권 밖으로 밀려났다.
페이스북 상황은 인공지능 사업이라는 것이 무작정 개인의 정보와 데이터를 많이 확보하면 된다는 세간의 격언을 다시 돌아보게 한다. 개인은 자신의 정보를 무한번 가공하고 활용하라고 플랫폼의 서비스를 이용하는 것이 아니다. 어떤 한국의 기업은 연인간의 메신저 대화를 분석하여 연인에게 필요한 서비스를 추천하겠다는 사업 계획을 발표하기도 했는데, 이는 사용자 관점에서는 매우 끔찍한 일이다. 연인간들의 사적인 대화를 누군가 들여다보는 것도 끔찍한데, 그것을 데이터화에서 인공지능 모델로 학습한다는 것은 정말 믿기 어려운 발상이다.
인공지능 산업의 연료가 분명 데이터인 것은 맞다. 그러나 기존 산업 혁명의 연료로 동물의 기름은 일부 썼어도 사람의 기름은 쓰지 않았던 것과 마찬가지로, 4차산업혁명의 중심 기술인 인공지능 엔진의 연료로 개인 데이터의 사용은 최소화하는 것이 바람직하다. 개인 데이터의 사용을 최소화하고 개인 데이터 활용에 대해 해당 개인에게 철저한 보상을 제공하는 사용자 중심의 인공지능 구조가 결국 지속가능성을 가질 것이다.
이러한 인식이 확대되면서, 2020년에는 전세계적으로 MyData 열풍이 불고 한국에서도 마이데이터사업자를 선정하는 노력이 지속되고 있다. 인공지능계에서도 MyAI라는 용어도 나오고 Human-Centered AI와 관련된 연구소가 스탠포드, MIT, UC버클리에 설립되기도 하였다.
한국에서는 하렉스인포텍과 경희대 빅데이터연구센터가 ‘사용자 중심의 인공지능(User Centric AI)’ 구조 연구 결과를 발표했다. 사용자 중심의 인공지능은, 사용자 가치를 극대화하는 것이 공급자와 플랫폼의 가치를 극대화할 것이라는 믿음하에, 개인 사용자의 가치를 극대화하는 인공지능 서비스 구조를 만드는 것이다. 우선 사용자에 대한 최소한의 정보만 수집하면서 서비스를 제공한다. 결과적으로 개인 사용자의 프라이버시를 보호하는 효과를 낸다. 이 과정에서 사업자(기업 사용자)의 데이터를 상호 공유하거나 통합하지도 않는다. 그러면서도 사업자들간에 안전하고 공평하게 협력하고 사용자에게도 적절하게 새로움과 혜택을 주는 인공지능 시스템 구조를 지향한다. 하렉스인포텍은 사용자 중심 결제 공유 플랫폼 서비스를 제공하는 기업으로, 사용자 중심 인공지능 연구소를 경희대와 협력해 설립하였다.
미국 인공지능 회사 오픈AI, 웨이모, 영국의 딥마인드 등이 인공지능 분야에서 거대한 업적을 낸 것에 비해 한국의 AI 기업들은 어땠을까. 한국도 만만하지 않다. 한국 AI 기업의 특징은 특정한 분야에서 1등을 달리는 전략을 구사하고 있다는 점이다. 뤼이드는 AI기반 에듀테크 분야에서 세계 1등을, 센드버드는 채팅API 분야에서 세계 1등을, 비프로컴퍼니는 스포츠 AI분야에서 세계 1등을 하고 있다. 적어도 이 기업들은 Zero-to-One을 실천한 기업이기에 세계 1등이다. 집단지성과 AI를 결합한 번역 플랫폼 플리토와 인공지능기술에 기반한 순환경제 기업 수퍼빈도 마찬가지로 제로투원을 실천한 한국의 인공지능 기업이다. 제로투원 기업이라는 것은 세상에 없었던 비즈니스 모델을 새롭게 만들어 그 분야 1등을 차지하고 있는 기업을 말한다. 이러한 제로투원 기업은 글로벌 1등을 할 수 있다는 데에 그 의의가 있다. 한국의 쿠팡은 미국의 소셜커머스 기업 그루폰을 따라한 기업이므로, 세계 1등을 할 수 없다. 한국 스타트업중에서 세계 1등을 할 수 있었던 기업은, 인터넷 전화 서비스 스타트업 다이얼패드와 세계최초의 성공한 소셜미디어 싸이월드가 있었다. 다이얼패드는 너무 빨랐던 비즈니스 모델이어서 결국 실패했고, 싸이월드는 미국, 일본, 독일, 중국, 대만, 베트남 등 세계 6개국에 진출했지만, 글로벌 진출 전략의 오류와 페이스북이라는 강력한 경쟁자의 등장으로 실패했다.
인공지능으로 대표되는 4차산업혁명시대의 기업들도 선점 효과에 따라 제로투원 기업이 훨씬 유리하다. 다만 네트워크 효과가 아니라 데이터 효과가 작동된다는 점이 다르다. 제품과 서비스, 비즈니스 모델에 데이터가 쌓임에 따라 경쟁력과 가치가 커지는 것을 데이터 효과라고 정의할 수 있다. 사용자가 늘면서 사용자 효용이 더 증가하는 네트워크 효과는 인터넷 플랫폼 기업을 설명하는 동시에 3차 산업혁명의 핵심 원리가 된 반면 4차 산업혁명을 주도하는 AI 기업의 대표적 원리는 데이터 효과다. 데이터를 원료로 AI 엔진을 가동하는 동시에 그 엔진의 성능을 계속 최적화하는 비즈니스 모델을 가진 기업이 미래를 주도할 것이다.
인공지능 시장의 또 다른 중요 트렌드는 기계학습을 한번에 끝내고 적용하는 것이 아닌, 계속적인 학습을 통해 기업이나 조직, 제품에 완전히 스며들게 하는 것이다. 기존 업계에서는 데브옵스(DevOps)라는 용어로 대표되기도 하지만, 인공지능 커뮤니티에서는 Active Learning이라고도 불리고, Continual Learning이라고 불리기도 한다.
액티브 러닝은 어떤 단계에 있는 인공지능 모델이 현실에서 작동을 하다가 제대로 대응하지 못하는 사례를 만나게 되면 작동하기 시작한다. 사람이 개입하여 그 데이터에 대해 레이블링을 수행하고, 기존 데이터 중에 비슷한 데이터를 다시 찾아 레이블링을 수정하며, 다시 인공지능 모델을 학습시키는 과정을 반복하는 것을 말한다. 세상에 완전한 자동화는 없다. 영화 설국열차에서 강제로 끌려간 5살 이하의 소년이 설국 열차를 끝없이 달리게 하기 위한 끝없는 유지 보수 노동을 하는 것은 조금 과장된 장면이긴 하지만, 모든 자동화에는 사람의 끊임없는 유지 보수 노동이 필요함을 보여주는 에피소드다.
역설적으로, 인공지능을 현업에 활용하는 조직들이 액티브 러닝이 필요하다는 것을 알게 된다는 것은 그만큼 성숙해졌다는 것을 의미한다. 한번 인공지능시스템을 개발하는 것이 중요한 것이 아니라 이를 계속적으로 유지하면서 성능을 높여가는 것이 더욱 중요하다는 것을 깨달았다는 의미이기 때문이다.
대부분의 인공지능 응용은 딥러닝에 기반한다. 기업은 딥러닝 모델의 목표를 설정하고, 이를 학습시키기 위한 데이터를 준비한다. 그 과정에서 완전히 데이터와 딥러닝에만 의존하지 않고, 기존 전문가의 도메인 지식을 활용할 수 있다. 전문가는 기존 지식을 제공할 수도 있고, 그 지식을 사용해 데이터에 레이블링을 할 수 있다. 결국 딥러닝 모델을 만들고 운용하는 과정에서 예외적 데이터가 발견될 때마다 사람이 개입해 데이터들을 다시 레이블링하는 이른바 액티브 러닝이 필요하다고 이해하면 된다.
회사는 좀더 최적화할 목표를 설정하여 이를 강화학습 방법으로 모델링할 수 있다. 1단계는 딥러닝만을 활용할 수 있으나, 2단계는 강화학습을 적용하는 것이 필요할 수 있다. 예를 들어 상품 추천 시스템을 개발하는 기업은 초기에는 협업 필터링이나 딥러닝 등을 활용하여 어떤 상품을 고객이 선택할 것인지를 예측하는 시스템을 개발할 수 있다. 일단 이를 개발하고 나면, 딥러닝이 추천한 고객이 선택할 가능성이 높은 상품들 중에 더욱 더 기업의 목표(예: 매출, 이익, 고객만족, 재고소진 등 당시의 목표)를 최적화하는 상품을 고르는 강화학습을 적용할 수 있다. 기업이 이렇게 하나의 사이클을 개발(Development)하고 나면, 이를 운영(Operation)하는 체계를 통해서 계속적으로 학습(Continual Learning)해 나가는 이른바 데브옵스(DevOps)과정을 구축할 필요가 있는 것이다.
인공지능은 최적화 시스템을 만드는 방법론의 하나다. 스타트업이든 기존 기업이든 인공지능을 제대로 활용하는 방법은 자신의 목표를 명확히 하는 것이다. 그 목표는 사회적, 경제적 가치가 높은 것을 할수록 기업의 성장과 지속가능성을 담보할 수 있다. 이 목표를 달성하기 위해 그 당시의 현업에 적용 가능한 인공지능 방법론을 적절히 선택하여 개발하고 운영하는 체계를 갖추고, 계속적으로 목표를 달성하는 모델로 교체해나가는 성과 기반의 운영체제를 구축해 나가는 것이 성공에 가깝게 가는 길이다.
페이스북 상황은 인공지능 사업이라는 것이 무작정 개인의 정보와 데이터를 많이 확보하면 된다는 세간의 격언을 다시 돌아보게 한다. 개인은 자신의 정보를 무한번 가공하고 활용하라고 플랫폼의 서비스를 이용하는 것이 아니다. 어떤 한국의 기업은 연인간의 메신저 대화를 분석하여 연인에게 필요한 서비스를 추천하겠다는 사업 계획을 발표하기도 했는데, 이는 사용자 관점에서는 매우 끔찍한 일이다. 연인간들의 사적인 대화를 누군가 들여다보는 것도 끔찍한데, 그것을 데이터화에서 인공지능 모델로 학습한다는 것은 정말 믿기 어려운 발상이다.
인공지능 산업의 연료가 분명 데이터인 것은 맞다. 그러나 기존 산업 혁명의 연료로 동물의 기름은 일부 썼어도 사람의 기름은 쓰지 않았던 것과 마찬가지로, 4차산업혁명의 중심 기술인 인공지능 엔진의 연료로 개인 데이터의 사용은 최소화하는 것이 바람직하다. 개인 데이터의 사용을 최소화하고 개인 데이터 활용에 대해 해당 개인에게 철저한 보상을 제공하는 사용자 중심의 인공지능 구조가 결국 지속가능성을 가질 것이다.
이러한 인식이 확대되면서, 2020년에는 전세계적으로 MyData 열풍이 불고 한국에서도 마이데이터사업자를 선정하는 노력이 지속되고 있다. 인공지능계에서도 MyAI라는 용어도 나오고 Human-Centered AI와 관련된 연구소가 스탠포드, MIT, UC버클리에 설립되기도 하였다.
한국에서는 하렉스인포텍과 경희대 빅데이터연구센터가 ‘사용자 중심의 인공지능(User Centric AI)’ 구조 연구 결과를 발표했다. 사용자 중심의 인공지능은, 사용자 가치를 극대화하는 것이 공급자와 플랫폼의 가치를 극대화할 것이라는 믿음하에, 개인 사용자의 가치를 극대화하는 인공지능 서비스 구조를 만드는 것이다. 우선 사용자에 대한 최소한의 정보만 수집하면서 서비스를 제공한다. 결과적으로 개인 사용자의 프라이버시를 보호하는 효과를 낸다. 이 과정에서 사업자(기업 사용자)의 데이터를 상호 공유하거나 통합하지도 않는다. 그러면서도 사업자들간에 안전하고 공평하게 협력하고 사용자에게도 적절하게 새로움과 혜택을 주는 인공지능 시스템 구조를 지향한다. 하렉스인포텍은 사용자 중심 결제 공유 플랫폼 서비스를 제공하는 기업으로, 사용자 중심 인공지능 연구소를 경희대와 협력해 설립하였다.
미국 인공지능 회사 오픈AI, 웨이모, 영국의 딥마인드 등이 인공지능 분야에서 거대한 업적을 낸 것에 비해 한국의 AI 기업들은 어땠을까. 한국도 만만하지 않다. 한국 AI 기업의 특징은 특정한 분야에서 1등을 달리는 전략을 구사하고 있다는 점이다. 뤼이드는 AI기반 에듀테크 분야에서 세계 1등을, 센드버드는 채팅API 분야에서 세계 1등을, 비프로컴퍼니는 스포츠 AI분야에서 세계 1등을 하고 있다. 적어도 이 기업들은 Zero-to-One을 실천한 기업이기에 세계 1등이다. 집단지성과 AI를 결합한 번역 플랫폼 플리토와 인공지능기술에 기반한 순환경제 기업 수퍼빈도 마찬가지로 제로투원을 실천한 한국의 인공지능 기업이다. 제로투원 기업이라는 것은 세상에 없었던 비즈니스 모델을 새롭게 만들어 그 분야 1등을 차지하고 있는 기업을 말한다. 이러한 제로투원 기업은 글로벌 1등을 할 수 있다는 데에 그 의의가 있다. 한국의 쿠팡은 미국의 소셜커머스 기업 그루폰을 따라한 기업이므로, 세계 1등을 할 수 없다. 한국 스타트업중에서 세계 1등을 할 수 있었던 기업은, 인터넷 전화 서비스 스타트업 다이얼패드와 세계최초의 성공한 소셜미디어 싸이월드가 있었다. 다이얼패드는 너무 빨랐던 비즈니스 모델이어서 결국 실패했고, 싸이월드는 미국, 일본, 독일, 중국, 대만, 베트남 등 세계 6개국에 진출했지만, 글로벌 진출 전략의 오류와 페이스북이라는 강력한 경쟁자의 등장으로 실패했다.
인공지능으로 대표되는 4차산업혁명시대의 기업들도 선점 효과에 따라 제로투원 기업이 훨씬 유리하다. 다만 네트워크 효과가 아니라 데이터 효과가 작동된다는 점이 다르다. 제품과 서비스, 비즈니스 모델에 데이터가 쌓임에 따라 경쟁력과 가치가 커지는 것을 데이터 효과라고 정의할 수 있다. 사용자가 늘면서 사용자 효용이 더 증가하는 네트워크 효과는 인터넷 플랫폼 기업을 설명하는 동시에 3차 산업혁명의 핵심 원리가 된 반면 4차 산업혁명을 주도하는 AI 기업의 대표적 원리는 데이터 효과다. 데이터를 원료로 AI 엔진을 가동하는 동시에 그 엔진의 성능을 계속 최적화하는 비즈니스 모델을 가진 기업이 미래를 주도할 것이다.
인공지능 시장의 또 다른 중요 트렌드는 기계학습을 한번에 끝내고 적용하는 것이 아닌, 계속적인 학습을 통해 기업이나 조직, 제품에 완전히 스며들게 하는 것이다. 기존 업계에서는 데브옵스(DevOps)라는 용어로 대표되기도 하지만, 인공지능 커뮤니티에서는 Active Learning이라고도 불리고, Continual Learning이라고 불리기도 한다.
액티브 러닝은 어떤 단계에 있는 인공지능 모델이 현실에서 작동을 하다가 제대로 대응하지 못하는 사례를 만나게 되면 작동하기 시작한다. 사람이 개입하여 그 데이터에 대해 레이블링을 수행하고, 기존 데이터 중에 비슷한 데이터를 다시 찾아 레이블링을 수정하며, 다시 인공지능 모델을 학습시키는 과정을 반복하는 것을 말한다. 세상에 완전한 자동화는 없다. 영화 설국열차에서 강제로 끌려간 5살 이하의 소년이 설국 열차를 끝없이 달리게 하기 위한 끝없는 유지 보수 노동을 하는 것은 조금 과장된 장면이긴 하지만, 모든 자동화에는 사람의 끊임없는 유지 보수 노동이 필요함을 보여주는 에피소드다.
역설적으로, 인공지능을 현업에 활용하는 조직들이 액티브 러닝이 필요하다는 것을 알게 된다는 것은 그만큼 성숙해졌다는 것을 의미한다. 한번 인공지능시스템을 개발하는 것이 중요한 것이 아니라 이를 계속적으로 유지하면서 성능을 높여가는 것이 더욱 중요하다는 것을 깨달았다는 의미이기 때문이다.
대부분의 인공지능 응용은 딥러닝에 기반한다. 기업은 딥러닝 모델의 목표를 설정하고, 이를 학습시키기 위한 데이터를 준비한다. 그 과정에서 완전히 데이터와 딥러닝에만 의존하지 않고, 기존 전문가의 도메인 지식을 활용할 수 있다. 전문가는 기존 지식을 제공할 수도 있고, 그 지식을 사용해 데이터에 레이블링을 할 수 있다. 결국 딥러닝 모델을 만들고 운용하는 과정에서 예외적 데이터가 발견될 때마다 사람이 개입해 데이터들을 다시 레이블링하는 이른바 액티브 러닝이 필요하다고 이해하면 된다.
회사는 좀더 최적화할 목표를 설정하여 이를 강화학습 방법으로 모델링할 수 있다. 1단계는 딥러닝만을 활용할 수 있으나, 2단계는 강화학습을 적용하는 것이 필요할 수 있다. 예를 들어 상품 추천 시스템을 개발하는 기업은 초기에는 협업 필터링이나 딥러닝 등을 활용하여 어떤 상품을 고객이 선택할 것인지를 예측하는 시스템을 개발할 수 있다. 일단 이를 개발하고 나면, 딥러닝이 추천한 고객이 선택할 가능성이 높은 상품들 중에 더욱 더 기업의 목표(예: 매출, 이익, 고객만족, 재고소진 등 당시의 목표)를 최적화하는 상품을 고르는 강화학습을 적용할 수 있다. 기업이 이렇게 하나의 사이클을 개발(Development)하고 나면, 이를 운영(Operation)하는 체계를 통해서 계속적으로 학습(Continual Learning)해 나가는 이른바 데브옵스(DevOps)과정을 구축할 필요가 있는 것이다.
인공지능은 최적화 시스템을 만드는 방법론의 하나다. 스타트업이든 기존 기업이든 인공지능을 제대로 활용하는 방법은 자신의 목표를 명확히 하는 것이다. 그 목표는 사회적, 경제적 가치가 높은 것을 할수록 기업의 성장과 지속가능성을 담보할 수 있다. 이 목표를 달성하기 위해 그 당시의 현업에 적용 가능한 인공지능 방법론을 적절히 선택하여 개발하고 운영하는 체계를 갖추고, 계속적으로 목표를 달성하는 모델로 교체해나가는 성과 기반의 운영체제를 구축해 나가는 것이 성공에 가깝게 가는 길이다.