인공지능(AI) 챗봇(채팅로봇) ‘이루다’를 만든 스캐터랩이 개인정보가 담긴 데이터를 폐기하지 않겠다는 방침을 고수해 도마에 올랐다. 이 회사는 자사 서비스 ‘연애의 과학’에서 대화 데이터 약 100억 건을 ‘이루다’ 학습에 활용하면서 이용자들로부터 제대로 동의를 받지 않았다는 의혹을 받고 있다.

14일 정보기술(IT)업계에 따르면 스캐터랩은 전날 밤 사과문과 추가 입장문을 발표했다. 이 회사는 이용자 중 AI 학습에 데이터가 활용되는 것을 원하지 않는 사람들의 카카오톡 대화는 개인정보보호법에 따라 데이터베이스(DB)에서 삭제하겠다고 밝혔으나 데이터 전량 폐기를 언급하지는 않았다. 대화 상대방인 제3자의 동의를 거치지 않았다는 지적에 회사 측은 “내부적으로 문제가 없을 것으로 판단했다”고 답했다. 연애의 과학 이용자와 시민단체들은 스캐터랩이 제대로 된 동의 절차를 거치지 않았으므로 대화 데이터를 모두 폐기해야 한다는 입장이다.

깃허브를 통해 유출된 개인정보 등의 문제에 대해 스캐터랩 측은 “개발팀이 2019년 깃허브에 공개한 내용에 대화 데이터가 포함된 사실이 확인됐다”며 “해당 깃허브 게시물은 즉시 비공개 처리했다”고 설명했다.

그러나 스캐터랩의 게시물을 포크(공유)한 게시물에 대해 개발자 커뮤니티에서는 우려가 나온다. 이미 깃허브 외부 크롤러 봇(온라인상에서 자료를 자동 수집·보존하는 프로그램)에 의해 국내외로 유출됐을 가능성도 점쳐지고 있다.

김남영 기자 nykim@hankyung.com