김세엽 셀렉트스타 공동대표(좌측), 신호욱 공동대표
김세엽 셀렉트스타 공동대표(좌측), 신호욱 공동대표
데이터의 중요성은 갈수록 커지고 있다. 많은 기업들이 막대한 비용을 들여 개발한 제품과 서비스를 선뜻 무료로 제공하는 것도 고객 데이터를 확보하기 위해서인 경우가 많다. 양질의 고객 데이터를 다수 확보해 이를 사업으로 치환함으로써 기업의 경쟁력을 강화할 수 있어서다.
이러한 상황에서 데이터를 처리하는 방법에도 관심이 커지고 있다. 데이터를 확보하는 것 자체도 어렵지만, 이를 제대로 활용하는 것도 중요하기 때문이다. 다만 이런 과정에 막대한 비용과 시간, 인력이 투입된다는 게 문제다. 데이터 내 세부 정보를 구분한 가공데이터를 재생산해 인공지능(AI) 학습 데이터의 품질을 높이는 ‘데이터 레이블링(분류)’ 기업이 주목받는 이유도 여기에 있다.
KAIST 학부생들이 창업한 AI 학습데이터 플랫폼 셀렉트스타는 이 부분에 착안해 색다른 방법론으로 해외 진출까지 이뤄낸 스타트업이다. 기업과 대중을 ‘크라우드 소싱’ 방식으로 연결해 고객 데이터를 수집한 후, 이를 유의미한 자료로 가공해주는 셀렉트스타의 애플리케이션(앱) ‘캐시미션’이 그 주인공이다. 데이터의 수집 가공 작업을 ‘리워드(보상)앱’과 결합한 비즈니스 모델이다.
데이터가 필요한 AI 기업이 데이터 생산 프로젝트를 셀렉트스타에 맡기면, 10만 명에 달하는 캐시미션 사용자들은 이와 관련된 미션을 수행하게 된다. 데이터를 업로드·가공한 사용자에게는 양과 정확도에 따라 환전 가능한 캐시가 차등적으로 지급된다. 김세엽 셀렉트스타 공동대표는 “사용자들이 수행한 프로젝트는 자체 개발한 수학적 알고리즘과 전수 검수를 통해 최종적으로 완성된다”며 “그렇게 탄생한 고품질 데이터를 고객사에게 전달한다”고 말했다.
기업 입장에서는 캐시미션 플랫폼을 통해 양질의 데이터를 빠르게 모을 수 있고, 다양한 사용자들로부터 데이터를 수급받을 수 있다는 장점이 있다. 기존에 리워드앱을 이용하며 낮은 보상에 피로감을 느꼈던 사용자들은 제대로 된 보상을 받으며 작업에 참여할 수 있어 만족도가 높다. 이를 통해 일반인도 1인당 한 달에 최대 90만원은 벌 수 있다는 게 회사 측의 설명이다. 김 공동대표는 “캐시미션의 크라우드소싱 모델은 다양한 데이터 수집, 빠른 데이터 생산, 저렴한 데이터 생산 비용, 확장성 있는 성장 등으로 AI학습데이터 문제를 해결하기 위한 최적의 솔루션”이라고 설명했다.
셀렉트스타의 가장 큰 강점은 데이터 품질이다. KAIST 박사진이 개발한 수학적 알고리즘을 기반으로 정확한 데이터 전수 검수를 거친 후 만들어진 고품질의 데이터를 고객사에게 제공하기 때문이다. 김 공동대표는 “전문 가이드라인 팀 운영을 통해 AI 성능에 직결되는 데이터 작업의 일관성을 확보하고 있다”며 “많은 작업자들의 데이터 수집 참여와 함께 유사한 데이터 수집을 딥러닝 기반으로 필터링해 데이터의 다양성을 보장한다”고 말했다.
2018년 11월 사업을 처음 시작할 무렵만 해도 성공 가능성이 낮아보였던 이 회사는 현재 삼성, LG, SK텔레콤, 네이버를 비롯해 183개 고객사를 보유할 정도로 빠르게 성장했다. 연 매출은 61억원, 누적 투자액은 44억원에 달한다. 해외 시장 공략도 준비 중이다. 신호욱 셀렉트스타 공동대표는 “지난해 11월 미국 현지에 법인을 설립했고, 현재 유의미한 해외 레퍼런스 확보에 근접해 있다”고 했다.
셀렉트스타는 현재 성공에 안주하지 않고 데이터 플랫폼 사업을 다방면으로 확장시키겠다고 강조했다. 김 공동대표는 “‘데이터는 셀렉트스타’라는 비전을 달성하기 위해 최선을 다하고 있다. 대규모의 크라우드가 활동하지만 데이터 품질은 높게 유지되며, 이를 통해 어떤 데이터든 하루만에 고품질로 구할 수 있는 데이터 플랫폼을 구축할 것”이라며 “AI 및 IT서비스 개발의 가장 큰 병목인 데이터 문제를 완전히 해결하는 것을 최종 목표로 하고 있다”고 전했다.

배성수 IT과학부 기자