“환자 데이터에 작은 실수가 있어요. 여성 표기 문제입니다. 훌륭한 자료에 다시 한번 감사드립니다.” 폴란드 시장조사업체 PBS의 미할 보가츠 연구원은 지난 8일 인공지능(AI) 개발자들의 최대 온라인 커뮤니티인 ‘캐글(Kaggle)’에 데이터 수정을 요청하는 글을 올렸다. 캐글에 등록된 신종 코로나바이러스 감염증(코로나19) 관련 한국 데이터를 활용하기 위해선 개선이 필요하다는 내용이었다. 앞서 3일에는 에릭슨과 링크트인 등에서 근무했던 데이터 과학자 재키 왕이 한국 환자의 흡연 여부와 사망한 환자들의 기저질환 데이터를 추가로 요청했다.
전염 가능성 예측부터 치료제 연구까지…'코로나와의 전쟁' 전세계 AI 고수들이 뭉쳤다
코로나19 해결에 나선 AI 개발자들

세계 AI 개발자들이 코로나19 확산에 따른 위기 극복을 위해 힘을 합치고 있다. 해외 정보기술(IT) 기업들은 자사 AI 역량을 코로나19 해결에 집중하고 있다. 반면 코로나19 극복에 첨단 IT를 활용하는 국내 기업은 보이지 않는다는 지적이 나온다.

국내외 AI 개발자들이 뭉친 곳은 캐글이다. 190여 개국 100만 명 이상의 AI 개발자가 다양한 AI 과제를 두고 다투는 경연장으로 유명하다. ‘AI 무림’의 숨은 고수들이 모여 ‘괴짜(geek)들의 UFC(종합격투기대회)’라고도 불린다. 캐글에서 코로나19 확산을 막겠다며 개발자들이 달려든 것은 한국의 관련 데이터가 배포되면서다. 한양대 빅데이터사이언스 연구실의 김지후 연구원이 지난달 24일 한국의 코로나19 관련 데이터를 처음 올렸다. 질병관리본부에서 나오는 공식 자료 등을 참고해 환자의 각종 정보, 감염 경로 등 AI 작업에 쓸 수 있도록 관련 데이터를 재가공해 공유했다.

처음엔 김 연구원 홀로 데이터화 작업에 하루종일 매달렸다. 지금은 뜻이 맞는 11명의 국내 데이터 과학자와 함께 관련 자료를 작성하고 있다. 앞서 미국 존스홉킨스대가 제공한 중국의 코로나19 데이터보다 상세하다는 평가를 받는다. 한국 코로나19 데이터를 AI로 분석하기 위해 세계 개발자들이 다운로드한 건수는 10일 기준 8657건에 달한다. 지금도 ‘가장 인기 있는 데이터’ 2위를 유지할 정도로 세계 AI 학계에서 관심을 받고 있다.

성과는 벌써 나오고 있다. 한국의 코로나19 확진자 증가 추이를 비슷하게 예측한 결과물이 대표적이다. 이 분석에 따르면 최악의 경우 오는 14일 확진자가 1만 명을 넘어설 전망이다. 이외에도 한국 데이터를 AI로 분석한 결과물이 63건 나왔다. 국내 지역과 나이별 감염 확률, 확진자 상태에 따른 격리 해제율 예측, 최종 확진자 수 전망 등 다양한 시도도 이뤄지고 있다. 김 연구원은 “데이터가 아직 부족하고 시작 단계이기 때문에 좀 더 신뢰성이 높은 결과는 기다려야 한다”고 설명했다.

코로나 치료법 개발 나선 해외 IT 기업들

AI 역량이 뛰어난 글로벌 IT 기업들도 발벗고 나섰다. 구글의 AI 전문 자회사 딥마인드는 자사의 의료용 AI를 코로나19 백신을 개발하는 데 투입했다. 순다르 피차이 구글 최고경영자(CEO)는 최근 “AI를 활용해 코로나 치료법 개발에 기여할 것”이라고 밝혔다.

중국의 알리바바는 AI가 환자의 폐 컴퓨터단층촬영(CT) 사진을 분석해 20초 만에 코로나19 감염 여부를 확인하는 기술을 내놨다. 보통 15분 정도 걸리는 작업이다. 바이두는 AI 기술을 활용해 코로나19의 유전자 구조를 분석하는 데 걸리는 시간을 55분에서 27초로 단축했다.

캐나다의 스타트업 블루닷은 세계보건기구(WHO)와 미국 질병통제예방센터(CDC)보다 코로나19의 확산을 먼저 경고해 화제가 되기도 했다. 블루닷은 세계 뉴스와 항공 데이터, 동식물 질병 데이터 등을 AI로 분석해 관련 보고서를 연초에 내놨다.

영국 스타트업 베네볼렌트AI는 코로나19의 화학적 특성을 빅데이터로 분석해 류머티즘 치료제 ‘바리시티닙’이 예방 효과가 있다는 의견을 내놓기도 했다.

하지만 국내에서는 AI를 활용해 코로나19 확산에 대응하는 기업을 찾기 어렵다. IT업계 관계자는 “AI의 경쟁력은 데이터를 활용한 경험이 많을수록 높아지는데 그동안 국내에서는 관련 규제에 막혀 역량을 쌓는 데 한계가 있었다”고 지적했다. 각종 데이터를 이전보다 자유롭게 이용할 수 있도록 하는 ‘데이터 3법(개인정보보호법·정보통신망법·신용정보법)’ 개정안은 우여곡절 끝에 지난 1월에야 국회를 통과했다.

김주완 기자 kjwan@hankyung.com