의료 인공지능(AI) 도구가 진단과 치료에서 인간 의사보다 높은 정확도를 보였다는 연구 결과가 나왔다. AI가 의료 현장의 보조 수단을 넘어 임상 판단 영역까지 파고들고 있다는 분석이 나온다.

17일(현지시간) 파이낸셜타임스(FT)에 따르면 독일 연구진이 개발한 의료 AI ‘미라(Mira)’의 충수염, 폐색전증 등 8개 질환에 대한 평균 진단 정확도가 87.1%를 기록했다. 의사 6명으로 구성된 평가단의 정확도(78.1%)를 웃도는 수준이다. 미라와 의사들은 응급실 사례 500여 건을 대상으로 진단 실력을 겨뤘다.

제미나이를 기반으로 구글이 개발한 ‘에이미(Amie)’도 치료 및 검사 계획 수립에서 의사보다 더 정확한 결과를 제시했다. 연구진은 영국의 최신 임상진료지침을 반영한 100개 진료 시나리오를 토대로 에이미와 의사 21명의 판단을 비교했다. 그 결과 에이미는 환자 관리와 치료 계획 수립 능력에서 의사들과 비슷한 수준을 보였고, 복잡한 사례에서는 약물 처방 관련 추론 능력이 더 뛰어난 것으로 평가됐다.

다만 전문가들은 이번 실험이 통제된 환경에서 이뤄진 만큼 의료 현장에 적용되기까지는 추가 검증이 필요하다고 강조했다. 실제 응급실에서 빈번하게 발생하는 환자의 정보 누락이나 진술 불일치 등의 문제가 충분히 반영되지 않았다는 것이다. 에이미 개발진 역시 “의료 현장에 즉시 적용할 단계는 아니다”며 “잠재적인 추론 오류를 줄이기 위한 추가 연구가 필요하다”고 밝혔다.

한명현 기자 wise@hankyung.com