의료 AI 쏟아져 나오지만 임상 정확도 검증된 것은 1%뿐

의료 영상분야 인공지능(AI) 중 실제 진료 상황에 맞춰 정확도를 검증한 것은 1%에 불과하다는 연구 결과가 나왔다. 제대로 임상 검증을 거친 의료용 AI가 거의 없다는 의미다.

박성호 서울아산병원 영상의학과 교수팀이 지난해 1~8월 세계에 출간된 의료 AI 관련 논문 516편을 분석했더니 이런 내용을 확인했다고 7일 밝혔다. 이번 연구 결과는 대한영상의학회 국제학술지(KJR) 3월1일자에 실렸다.이들 논문 중 AI의 정확도를 외부검증 받은 논문은 6% 정도였다. 실제 임상 진료상황에 맞춰 정확도를 검증한 것은 1%, 이보다 좀더 엄밀한 기준으로 임상 정확도를 검증한 것은 없었다.

의료용 AI 소프트웨어 프로그램으로 진단을 하다가 오류가 나면 환자 건강에 위해가 될 수 있고 불필요한 의료비 상승으로 이어질 수 있다는 게 박 교수팀의 설명이다. 그는 "그동안 의료 AI의 임상적 정확도를 제대로 검증하지 않는 것에 대해 세계 의학계에서 많은 문제제기가 있었지만 실제 자료로 확인한 것은 이번이 처음"이라고 했다. 그는 "예상보다 낮은 결과에 연구진도 놀랐다"며 "의료 및 의학영상 AI 분야에서 임상검증을 얼마나 간과해 왔는지 그간의 민낯을 보여주는 결과"라고 했다.

그는 정부가 의료 AI 산업을 육성하고 경쟁력을 높이기 위해서는 제대로 된 임상검증을 지원해야 한다고 했다. 박 교수는 "초기 연구결과만 가지고 섣불리 환자에게 적용하려 하거나 임상검증을 간과하고 상업화에 집중하는 것은 부적절하다"며 "앞으로 의료 AI 분야 임상검증의 중요성을 높이는 계기가 되기를 바란다"고 했다.또 "그간 의료 AI의 임상검증이 간과된 이유 중 하나는 개발자나 산업계가 임상검증에 대한 자세한 정보를 접할 기회가 적었기 때문"이라며 "앞으로 의료인들이 AI 개발자나 산업계와 좀 더 적극적으로 소통하고 교육과 정보제공의 기회를 만들어야 할 것"이라고 덧붙였다.

이지현 기자 bluesky@hankyung.com

핫이슈