본문 바로가기

    ADVERTISEMENT

    "AI가 의사보다 정확"…의대생 연구서 진단 정확도 앞서

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    의료진 정확도 85%…GPT-4o 88.4%, o1 94.3%
    동일 증례 5회 반복 분석…AI 판단 일관성도 확인
    "의료진 판단을 대체하기 보다는 보조하는 도구"
    사진=게티이미지뱅크
    사진=게티이미지뱅크
    국내 의과대학 본과생들이 실제 임상 증례 분석에서 인공지능(AI)이 의료진과 비교해 더 높은 판단 정확도를 보일 수 있음을 확인했다.

    연세대학교 용인세브란스병원 심장내과 배성아 교수와 정신건강의학과 박진영 교수, 연세의대 본과 4학년 정재원·김현재 학생 연구팀은 오픈AI 멀티모달 및 추론 AI 모델(GPT-4o, o1)의 임상 판단 정확도를 의료진 응답과 비교·분석한 연구 결과를 10일 발표했다.

    이번 연구는 교수의 지도 아래 의대 본과생들이 연구 설계부터 데이터 분석, 논문 작성까지 전 과정을 주도했다는 점에서 의학교육과 AI 의료 연구 측면에서 의미 있는 성과로 평가된다.

    연구팀은 2011년부터 2024년까지 의료 교육 플랫폼 '메드스케이프(Medscape)'에 공개된 1426건의 임상 증례를 분석했다. 각 증례에는 환자의 상세한 병력, 신체 검사 소견, 혈액 검사 결과는 물론 X-ray(엑스레이), CT(컴퓨터단층촬영), MRI(자기공명영상), 초음파, 심전도, 병리 슬라이드 등 총 917건의 의료 영상이 포함돼 실제 임상에서 접하는 복잡한 진단 상황을 반영했다.

    분석 결과 다수의 의료진이 선택한 답안의 정확도는 85.0%였으며, GPT-4o는 88.4%, 최신 추론 모델인 o1은 94.3%의 정확도를 기록했다. 의료 영상이 포함된 증례만을 별도로 분석한 경우에도 두 모델 모두 유의미하게 의료진보다 높은 정확도를 보였다.

    특히 o1 모델은 진단(92.6%), 질병 특성 파악(97.0%), 검사 계획(92.6%), 치료 방향 설정(94.8%) 등 모든 임상 판단 영역에서 90% 이상의 정확도를 유지했다. 내과·외과·정신과 등 전공 분야와 관계없이 안정적인 성능을 나타냈다.

    연구팀은 동일한 증례를 5회 반복 분석해 AI 모델의 판단 일관성도 검증했다. GPT-4o는 86.2%의 증례에서, o1은 90.7%의 증례에서 5번 모두 정확한 답을 제시했다. 이는 AI 모델이 단순한 우연이나 무작위 선택이 아닌 체계적인 추론을 바탕으로 답을 도출하고 있다는 것을 보여주는 결과다.

    연구를 주도한 학생들은 "1년 이상 데이터를 수집하고 분석하며 통계를 배우는 과정이 쉽지 않았지만, AI가 실제 임상에서 어떻게 활용될 수 있을지 직접 확인한 것이 가장 큰 보람"이라며 "학부생이라도 연구에 관심이 있으면 교수님께 직접 연락해 지도받을 수 있는 환경이 도움이 됐다"고 말했다.

    배성아·박진영 교수는 "이번 연구는 AI 모델이 텍스트와 의료 영상을 통합해 실제 임상 수준의 판단을 내릴 수 있다는 것을 객관적으로 입증한 사례"라며 "이는 AI가 의료진의 판단을 대체한다기보다, 복잡한 임상 상황에서 의사 결정을 보조하고 안정성을 높이는 도구로 활용될 수 있음을 보여준다"고 말했다.

    이번 연구는 보건복지부와 한국보건산업진흥원의 '가상환자·가상병원 기반 의료기술 개발 사업'(연구책임자 박진영)의 지원을 받아 수행됐다. 연구 데이터와 분석 코드는 오픈소스 플랫폼 깃허브(GitHub)를 통해 공개해 전 세계 연구자가 활용할 수 있도록 했다.

    연구 결과는 국제학술지 ‘Medicine (Baltimore)’ 2026년 1월 호에 게재됐다.

    유지희 한경닷컴 기자 keephee@hankyung.com

    ADVERTISEMENT

    1. 1

      다우 '사상 최고치' 경신…서울 아파트 시총 '역대 최대' [모닝브리핑]

      ◆뉴욕증시, 기술주 랠리에 강세…다우 사상 최고뉴욕증시 3대 지수가 강세로 마감했습니다. 다우존스 지수는 사상 최고치를 기록했습니다. 현지시간 9일 다우존스 지수는 전장보다 0.04% 상승한 5만135....

    2. 2

      앤트로픽발 'AI 쇼크'…사모대출 시장에도 '경고음' 나왔다

      미국 사모대출 시장이 새로운 불확실성에 직면했다는 경고음이 나왔다. 연합뉴스에 따르면 미국 경제 매체 CNBC는 8일(현지시간) 앤트로픽이 내놓은 인공지능(AI) 도구 '클로드 코워크' 등이 ...

    3. 3

      일당 100만원인데 "지원자가 없어요"…발칵 뒤집힌 곳

      경남 합천군의 의료공백 우려가 커지고 있다. 공중보건의 복무기간이 오는 4월 대거 만료되지만, 군이 추진한 신규 관리 의사 채용에 지원자가 한 명도 나타나지 않았기 때문이다.7일 합천군에 따르면 현재 군내에서 근무 ...

    ADVERTISEMENT

    ADVERTISEMENT