美 의사 면허시험 통과한 챗GPT, 의사라 불러야 할까
올해는 정보기술(IT) 역사에서 챗GPT의 해로 기억될 전망이다. 음성 인식 스피커나 ‘알파고’ 등장을 넘어서는 충격이다. 하지만 만능처럼 보이는 챗GPT가 답변하기 어려워하는 분야가 있다. 의료 관련된 내용이다.

챗GPT를 만든 오픈AI사는 가이드라인을 통해 “의료는 그 답변의 결과가 생명과 직결되기 때문에 본인들이 답변할 수 있는 영역에 해당하지 않는다”며 ‘지원하지 않은 사용 분야’에 해당한다고 선을 그었다. 실제로는 다르다. 의료 분야의 챗GPT 도입은 적극적으로 검토되며, 쓰이고 있고, 더 쓰일 가능성이 크다. 방대한 학습 결과를 의사·바이오·의료 행정·심리 전문가들이 활용할 방법이 무궁무진하다. 최근 들어 챗GPT가 MBA와 로스쿨 시험을 넘어 미국의 의사면허시험(USMLE)까지 통과했다는 소식이 전해졌다. 챗GPT의 또 다른 가능성이 확인된 셈이다.

챗GPT의 기반 언어모델(GPT)은 문장이 아니라 문단 내에서 단어의 위치나 빈도를 가지고 그 쓰임을 추정한다. 중요한 건 이를 위해 데이터를 사전에 학습한다는 점이다. 사전 학습의 대상은 이 세상에 존재하는 모든 텍스트가 될 수 있다.

미국의 유명 IT 전문가 베네딕트 에번스의 말을 빌리면 “도서관에 있는 모든 책을 다 읽어버린 10살짜리 아이”와 같은 챗봇이 탄생한 것이다. 참고로 챗GPT는 GPT-3.5에 해당한다. 연내 출시를 예상하는 GPT-4는 100조 개의 스킬셋(능력 집합)을 사전 학습하는 것으로 알려졌다.

지식이라는 건 텍스트의 그럴듯한 나열이 아니다. 작은 실수가 환자의 생명으로 직결된다. 의료 지식의 나열이 시험 합격에 유효할 수 있겠지만, 의료 행위의 성공 여부에는 큰 도움이 되지 못한다. 의사는 많은 임상과 경험, 환자 상태에 대한 판단, 숨소리, 분위기에도 영향을 받는다. GPT가 의사의 판단 아래 활용돼야 하는 이유다. 마침 의사가 환자 치료를 위해 쓸 수 있는 시간은 제한적이다.

2020년 대한의사협회 의료정책연구소 조사에 따르면 환자 한 명당 의사의 진료 시간은 평균 11.8분이다. 환자를 파악하기 턱없이 부족한 시간이다. 의사가 챗GPT와 개인 건강 기록(PHR)을 잘 활용할 수 있다면 환자를 파악하는 시간, 관련 의학 정보를 탐색하는 시간을 비약적으로 줄일 수 있다. 환자의 증상과 관련된 새로운 의학 연구 역시 쉽게 알아낼 수 있다. 환자에 대한 경험이나 암묵지가 많지 않은 개원의에게도 큰 도움이 될 것이다. 도서관의 모든 책을 다 읽은 지치지 않는 조수가 곁에 있는 것이다. 이 때문에 만성 폐쇄성 폐질환(COPD)을 치료하는 스타트업인 미국 앤씨블헬스처럼 연구에 챗GPT를 활용하는 곳도 늘고 있다.

챗GPT의 활용에서 가장 중요한 것은 무엇을 물을지, 무엇을 들을지가 될 가능성이 크다. 조수에게 잘 묻고, 조수의 말 중 의미 있는 걸 잘 이해하는 역량이 중요해진 것이다. 고학력 의사들은 이 부분에서 어떤 전문 집단보다 강점이 있다. 더 적극적으로 활용해야 하는 이유다. 의사가 아닌 이들은 어떻게 잘 물을지, 어떻게 대답을 이해해야 할지 어려울 수 있다. 이 부분을 공략하는 디지털 헬스케어 솔루션도 세상에 등장할 것이다. 굿닥의 경우에도 10여 년간의 디지털 헬스케어 경험을 바탕으로 GPT 응용 프로그램 인터페이스(API)를 활용한 ‘건강 AI’를 제공하고 있다.

챗GPT는 의료 분야에서 책임을 지지 않는 엄청나게 똑똑한 조수 그 이상이 되기는 어렵다. 조수는 의료 행위에 일체 책임을 지지 않으며 전문가가 묻는 말에 학습한 것을 그럴듯하게 답변해줄 뿐이다. 그럼에도 꾸준하게 도움을 받아야 한다. 조수가 가진 방대한 학습량과 활용도를 의사는 따라잡을 수 없다.

배진범 굿닥 전략 책임