AI 의사 나오나…진단영상 검증 능력, 효율성 더 높아

AI 의사 나오나…"진단영상 검증 능력, 효율성 더 높아"

김소연

입력2024.04.17 08:42 수정2024.04.17 08:42

오픈AI 인공지능이 X-선 사진 등 진단 영상에서 오류를 찾아내는 능력이 영상의학 전문의들과 비슷한 수준이면서도 시간과 비용 효율성은 사람보다 훨씬 높다는 조사 결과가 나왔다.

독일 쾰른 대학병원 영상의학과 로만 게르츠 박사팀은 17일 북미영상의학회(RSNA) 저널 래디올로지(Radiology)에서 오픈AI의 거대언어모델(LLM) 인공지능 GPT-4와 다양한 경험 수준의 영상의학 전문의들을 대상으로 한 진단 영상 오류 검증 비교실험에서 이 같은 결과를 얻었다고 전했다.

연구팀은 이 연구가 진단 영상 오류 검증에서 GPT-4와 인간의 능력을 비교한 첫 연구로, AI가 영상의학 보고서 작성의 정확성과 효율성을 높일 잠재력이 있음을 보여준다고 의미를 밝혔다.

인간과 GPT-4 비교 연구는 2023년 6월부터 12월까지 한 병원에서 200건의 X-선 사진과 CT/MRI 영상을 수집하고, 이 중 100건에 누락·삽입·철자·방향 혼동·기타 등 5개 범주의 오류 150개를 의도적으로 삽입해 이를 찾아내는 방식으로 진행했다. 이후 GPT-4와 영상의학과 선임 전문의 2명, 주치의 2명, 레지던트 2명의 정확성과 속도, 비용 효율성 등을 비교했다.

GPT-4는 오류 150개 중 124개를 찾아낸 오류 감지율 82.7%를 기록했고, 사람 전문가의 오류 감지율은 각각 영상의학 선임 전문의가 89.3%(150개 중 134개), 주치의 80%(150개 중 120개), 레지던트 80%(150개 중 120개)였다. GPT-4의 오류 감지율은 영상의학과 수석전문의 2명을 제외하면 가장 높은 수준인 것. 이는 GPT-4와 영상의학 전문의 사이에 오류 감지율에 유의미한 차이가 없음을 의미한다.

여기에 GPT-4는 속도와 비용 효율성은 영상의학 전문의들보다 훨씬 높은 것으로 조사됐다. GPT-4의 진단 영상 1건당 판독 시간은 평균 3.5초였으나, 이 연구에서 판독 속도가 가장 빠른 전문의의 판독 시간은 1건당 평균 25.1초였다. 또한 GPT-4는 진단 영상 1건당 평균 보정 비용이 0.03달러로 비용 효율이 가장 높은 전문의(건당 0.42달러)의 10분의 1 미만이었다.

게르츠 박사는 "GPT-4가 진단 영상의 오류를 감지, 보정하는 업무에서 영상의학 전문의와 맞먹는 성능을 발휘하면서도 시간과 비용은 크게 줄일 수 있음을 연구 결과가 보여준다"며 "GPT-4를 활용해 영상의학 보고서의 정확성을 높여 환자 치료를 개선할 수 있다는 점에서 의미가 있다"고 전했다.

김소연 한경닷컴 기자 sue123@hankyung.com

김소연 기자

한경닷컴
김소연 기자입니다.

관련 뉴스

1

환자단체 "국회, 선거 이유로 환자 고통 외면…의료공백 중재해야"

한국암환자협의회 등 6개 중증질환 환자 단체가 모인 한국중증질환연합회는 15일 국회를 향해 "지난 두 달간 선거를 이유로 강 건너 불구경하듯 환자들의 고통을 외면해 왔다"며 "정부와 의료계가 조속히 의료 공백 사태를...
2

이길여 "포탄 날아오는 6·25 때도 책 놓지 않아" 의대생 복귀 호소

정부의 의대 증원 정책에 반발하는 전국 의대생들의 수업 거부가 이어지는 가운데, 이길여 가천대학교 총장이 학교로 복귀하라고 호소했다.8일 가천대 의대 홈페이지에는 이길여 총장 명의로 '사랑하고 자랑스러운 가천...
3

"의대 2000명 증원, 내 이름 때문?"…천공, 의혹에 입 열었다

역술인 천공(이천공)이 정부의 의대 정원 2000명 확대안이 자신의 이름에서 비롯됐다는 의혹에 정면 반박했다.천공은 4일 유튜브 채널 '정법시대'에 올린 '윤석열 정부와 숫자 2000'이...