[윤나리의 임상 바로 읽기] 임상적 이익과 위험의 저울질(trade-off) : 임상시험과 안전성 관리
‘독성학의 아버지’로 알려진 스위스 의사이자 화학자 파라셀수스(1493~1541)는 “모든 물질은 독”라고 말했다. 독성 없는 약물은 존재하지 않는다는 것이다. 실제로 임상개발이란 끊임없이 신약의 임상적 효능과 위험성을 저울질하는 과정이라고 할 수 있다. 많은 사람이 더 나은 신약 효능에 열광하지만, 안전성이 뒷받침되지 않는 효능은 허상에 불과하다. 이번 연재에서는 임상시험과 안전성 관리에 대해 살펴본다.신약 개발 목적이 환자에게 더 나은 치료제를 제공하기 위함이라는 것을 떠올리면, 대부분의 경우 왜 신약의 부작용보다 유용성에 더 큰 관심을 두는지를 쉽게 이해할 수 있다. 그러나 신약으로 발생할 수 있는 부작용에 대한 이해가 늦어지면 늦어질수록 치러야 할 대가는 커진다. 임상 개발 프로그램 전체가 주저앉는 것도 문제지만 환자의 안전, 나아가 생명과도 직결되기 때문이다. 사례들을 통해 신약 개발 과정에서 안전성 관리의 중요성에 대해 곰곰이 생각해 보자. ‘코끼리 임상시험’이라는 오명 : TGN1412의 사례 TGN1412는 CD28 작용제로 2006년 독일의 테제네로(TeGenero)가 백혈병 및 자가면역질환 치료제로 개발한 물질이다. 우리 몸에서 면역반응이 일어나기 위해서는 T세포가 항원을 인식하고 활성화돼야 하는데, 이때 중요한 역할을 하는 단백질이 T세포에 발현하는 CD28 단백질이다. 체내에 감염원 등이 침입하면 수지상세포와 같은 항원제시세포는 CD80·CD86 단백질을 고발현시키는 동시에 조직적합성복합체(MHC) 단백질을 통해 T세포에 항원을 제시한다. 이때, MHC 단백질은 T세포 표면의 T세포 수용체에 결합하고, CD80·CD86은 CD28 단백질과 결합하면서 T세포가 활성화된다. 동물실험에서 TGN1412는 저용량에서는 조절 T세포를 활성화시키고 고용량에서는 조절 T세포와 세포독성 T세포를 모두 활성화시키는 것으로 확인됐다. 실제 2006년 3월 첫 번째 임상시험에서 시험대상자에게 투약되기 전까지 TGN1412는 다양한 동물 모델에서 안전하고 효과적인 것으로 평가됐다. 이후, 사람의 CD28 수용체와 100% 서열 상동성을 가져 TGN1412의 독성을 평가하기 적합한 종으로 평가된 시노몰구스 원숭이(Cynomolgus monkey)와 레서스 원숭이(Rhesus monkey)에서 반복 독성시험이 수행됐다. 이 독성시험에서 5~50mg/kg의 TGN1412가 매주 투여됐는데 이때 최고 용량인 50mg/kg에서도 별다른 독성은 관찰되지 않았다. 최대 무독성용량(NOAEL)은 50mg/kg/week로 설정됐다.TGN1412는 당시로서는 다소 생소한 작용기전을 가진 약물이었지만 이러한 전임상 결과를 바탕으로 영국 규제기관으로부터 첫 사람 임상(first-in-human) 시험을 승인받았다. 당시에는 NOAEL을 기준으로 첫 투약 용량을 선정하는 것이 일반적 관행이었다. 원숭이 NOAEL 50mg/kg을 사람 용량으로 변환해 안전성 마진을 좀 더 둔, 0.1mg/kg에서 첫 투약이 진행됐다. 2006년 3월 13일, 런던에 위치한 노스위크 파크 병원 내에 위치한 글로벌 임상수탁기관(CRO) 파렉셀이 독립적으로 운영하는 병동에서 건강한 6명의 남성 자원자에게 TGN1412가 정맥으로 주사됐다. 그리고 어떤 일이 벌어졌을까. 말 그대로 진정한 재앙이 발생했다.투여 직후 건강했던 자원자 여섯 명 모두에게서 다장기 부전증을 동반한 사이토카인 방출 신드롬(CRS)이 발생했다. 그중 두 건은 생명을 위협할 정도로 심각한 수준이었다. 투여 16시간 후, 이들 모두 중환자실로 옮겨졌고 이후 3주간 사경을 헤맸다. 그 중 가장 심각했던 한 명은 머리가 정상 크기의 3배로 부어오르고, 호흡곤란 등 심각한 부작용으로 한동안 기계 호흡에 의존해야만 했다.자원자들의 머리가 부어올라 코끼리처럼 됐다고 해서 이 사건은 ‘코끼리 임상시험’이라는 오명으로 불리기도 한다. 다행스럽게도, 이들 여섯 명 모두 무사히 퇴원할 수 있었지만 이 사건은 이 임상시험에 참여한 자원자들, 시험 관련자들, 허가기관, 학계, 더 나아가 사회 전반에 큰 충격을 줬다. 어쩌다 이런 일이 발생한 걸까. 이 사건이 발생한 이후 여러 해 동안 많은 과학자가 원인 규명에 매달렸다. 여러 원인이 있었지만, 무엇보다 원숭이에서 진행한 독성시험 결과를 너무 믿은 게 문제가 됐다. 이후 밝혀진 사실이지만 사람의 CD28 수용체와 100% 서열 상동성을 가진 것으로 ‘생각’됐던 시노몰구스 원숭이와 레서스 원숭이의 CD28 수용체는 아미노산 서열이 사람과는 최대 4% 달랐다.뿐만 아니라, 시노몰구스 원숭이의 경우 T세포에 CD28 단백질 발현이 사람에 비해 적음이 이후에 밝혀졌다. CD28 단백질 발현량이 적으니 CD28 작용제인 TGN1412가 고용량 투여돼도 사이토카인 방출 신드롬 등의 부작용 발생이 덜했던 것이다.뿐만 아니라, 대부분 설치류 세포를 이용해 체외(in vitro) 세포실험이 진행돼 사람에서의 면역반응을 모방하기 어려웠던 점도 문제로 지적됐다. 사람과 원숭이, 사람과 설치류의 종간 표적단백질의 발현 정도, 결합력 차이 등을 고려하지 않은 채 투여 용량인 0.1mg/kg이 선정돼 결과론적으로는 너무나 고용량이 투여됐다. 이후에 밝혀진 사실이지만, 사람에 투여됐던 0.1mg/kg은 CD28 수용체 점유율이 60%에 달했을 뿐만 아니라 염증성 사이토카인 분비를 유도하는 포화 농도에 해당됐다. TGN1412의 경우 비임상 결과를 통해 임상에서 발생할 수 있는 안전성 문제를 예측하는 데도 실패했지만, 임상시험을 설계하고 수행하는 과정에서 안전성 관리 자체에도 큰 문제가 있었다. 첫째, 기전적으로 생소하고 잠재적으로 예측되지 않은 부작용이 발생할 가능성이 있는 약물임에도 여섯 명의 자원자 모두에게 TGN1412가 ‘거의 동시에’ 투약됐다. 여섯 번째 환자가 투약될 무렵 첫 자원자는 이미 이상반응을 보이고 있었다. 그럼에도 불구하고 연구진은 마지막 자원자에게 TGN1412를 투약했다. 신약의 첫 번째 임상시험의 경우 약물 투약 후 발생할 수 있는 이상반응을 예측하기 어렵기 때문에 첫 환자 투약 후, 가령 48시간 내지 72시간 동안 발생하는 이상반응을 충분히 관찰한 후 이상이 없으면 다음 환자에게 약물을 투약하는 방식으로 임상시험을 설계한다. 그런데 TGN1412 임상의 경우 이러한 설계가 적용되지 않았다.둘째, 약물이 원숭이때 보다 10배나 빠른 속도로 정맥주사 됐다. 빠르게 정맥주사를 하다 보니 급격한 반응이 일어날 가능성이 높아질 수밖에 없었다.셋째, 기전적으로 발생 가능한 이상반응, 예컨대 사이토카인 방출 증후군 등에 대한 연구자 인지 및 교육이 매우 부족했다. CD28을 자극하는 물질의 경우 면역반응이 갑자기 활성화돼(원숭이 독성시험에서는 나타나지 않았지만) 투약 후 사이토카인 방출 증후군이 일어날 수도 있는 상황이라면, 이에 대비를 해야 했는데 그러지 못했다. 연구자들이 갑자기 닥친 상황에 허둥지둥할 수밖에 없었던 이유다.넷째, 임상시험이 수행된 장소는 병원이 아닌 글로벌 CRO 파렉셀이 독립적으로 운영하는 병원 내 병동이었다. 아무래도 사이토카인 방출 증후군과 같은 급격한 임상적 악화에 대한 진단과 대응 경험이 부족할 수밖에 없었고 이는 진단과 치료 지연으로 이어졌다. 이토록 사회 전반에 큰 충격을 주었던 TGN1412는 놀랍게도 여전히 임상개발 단계에 있다. 실패를 용인하지 않는 한국 사회에서는 보기 어려운 일이다. 테제네로는 이후 펀딩에 실패하며 사실상 역사 속으로 사라졌지만 물질은 테라맵(TheraMab)을 통해 TAB08이라는 이름으로 다시 개발되고 있다. 사건이 있은 지 수년 후, TAB08의 새로운 1상 임상시험이 30명의 건강한 자원자를 대상으로 수행됐다. 이때, 시작 용량은 코끼리 임상시험에 비해 1000배 낮은 0.0001mg/kg으로, 용량 증량은 천천히, 그리고 신중히 이뤄졌다. 임상시험은 경험이 풍부한 대학병원에서 수행됐고, 자원자들은 충분한 간격을 두고 약물을 투약받았다. 정맥주사는 매우 천천히 진행됐을 뿐만 아니라 이전 임상시험에서 관찰한 이상 반응이 발생할 경우 즉각적으로 대응할 수 있도록 충분한 교육과 환경이 갖춰졌다. 놀랍게도, 이 임상에서 TAB08은 내약성이 우수한 것으로 평가됐다. 임상에서 파악하기 어려웠던 이상반응 : 피아루리딘 간독성 사례 이와 같이 신약의 이상반응은 효능만큼이나 면밀하게 관찰되고 그 특성 역시 제대로 파악돼야 한다. 그러나 종종 초기 임상 단계에서도 관찰되지 않았던 이상반응들이 2상, 3상 단계에서 발생되고, 이러한 예상하지 못한 이상반응으로 인해 임상개발이 중단되는 사례들도 있다. 피아루리딘의 사례를 살펴보자. 피아루리딘은 티미딘(thymidine) 아날로그로 1990년대 B형간염 치료제로 일라이릴리가 개발했던 약물이다. 피아루리딘의 경우 생쥐, 랫(rat), 개, 원숭이, 그리고 마멋(marmot)에서 수행된 동물실험에 사람에서 투약된 용량보다 100배 높은 용량이 투여됐음에도 불구하고 독성 반응이 일어나지 않았다. 심지어는 43명의 환자를 대상으로 2주 또는 4주 기간 수행된 초기 임상시험에서도 특별히 눈에 띄는 이상반응은 발생하지 않았다. 문제는 1993년에 진행된 2상 임상시험에서 발생했다. 이 임상시험은 피아루리딘 0.1mg/kg 및 0.25mg/kg을 매일, 24주간 투약하는 공개 라벨, 무작위 배정 임상시험이었다.임상시험이 시작된 지 약 3개월이 경과한 1993년 6월 초, 약 10명의 환자에서 구역, 구토, 설사 및 복통 등 이상반응 증가가 관찰되기 시작했다. 6월 중순에 이르자 3명의 환자는 이상반응으로 더 이상 피아루리딘을 투약할 수 없었다.6월 25일, 투여를 중단한 3명 중 1명의 환자, 그러니까 당시까지 약물을 투여받던 15명의 환자 중 1명이 급격한 젖산산증, 간부전 및 신부전으로 입원을 하게 됐다. 6월 26일 임상시험은 즉각 중지됐고 피아루리딘 투여 역시 중지됐다. 그러나 안타깝게도 피아루리딘 투여를 중지했음에도 불구하고 이들 중 7명의 환자에서 추가로 심각한 간부전이 발생했고, 이 중 다섯 명은 사망, 나머지 2명은 간이식을 받고 겨우 생존할 수 있었다. 흥미로운 것은 대부분의 환자가 8주 차까지는 상대적으로 경증의 이상반응만을 보고했다는 점이다. 투약 후 9주 차를 기점으로 이상반응의 중증도가 증가하기 시작했다. 초기 임상에서는 파악할 수 없었지만, 장기 투약 시 미토콘드리아 손상으로 인한 지연성 간독성이 발생한 것으로 평가됐다.사후약방문 같은 일이긴 하지만, 이 사건이 발생한 이후 B형간염을 유발한 마멋에서 간독성을 평가하기 위한 비임상 독성시험이 수행됐다. 투약 후 8주까지는 혈청 내 간염 바이러스 감소 이외에 별다른 독성 프로파일이 관찰되지 않았다. 그러나 12주 이후부터 마멋들은 몸무게가 줄고 전형적인 미토콘드리아 손상 소견을 보이기 시작했다. 적절한 모델에서 장기 투여 비임상 독성이 제대로 수행됐다면, 또 그 결과를 제대로 해석하고 임상시험 수행 시 면밀히 관찰했다면 피해를 최소화할 수 있었을 것이다. 임상시험 중 안전성 관리 임상시험 중 안전성 관리에 대해 구체적으로 논하기에 앞서 안전성 결과를 기술할 때 자주 등장하는 안전성 관련 용어들에 대해 살펴보자. • 이상반응(AE·Adverse Event) 임상시험용 의약품을 투여한 시험대상자에게 발생한 모든 유해하고 의도하지 않은 증후, 증상 또는 질병을 말한다. 이때 약물과 반드시 인과관계를 가져야 하는 것은 아니다. • 약물이상반응(ADR·Adverse Drug Reaction) 임상시험용 의약품의 임의 용량에서 발생한 모든 유해하고 의도하지 않은 반응으로, 임상시험용 의약품과 인과관계를 부정할 수 없는 경우로 정의된다. 만약, 어떤 시험대상자가 타이레놀을 투약한 이후 길을 가다가 넘어져서 무릎에 출혈이 발생했다면, ‘출혈’은 이상반응에 해당된다. 타이레놀과 인과관계는 없지만 의약품을 투여한 대상자에게 유해한 증상이 발견되었으므로 이상반응으로 보고된다. 다만 이 경우, 약과의 관련성은 ‘관련성이 없음(Not related)’으로 보고될 것이다. 그런데 이 환자가 집으로 돌아와 근육통이 생겼다고 가정해보자. 이 경우엔 타이레놀 복용과 근육통의 인과관계를 완전히 배제할 수 없을 수 있다. 그렇다면 근육통은 타이레놀의 약물 이상반응으로 보고될 수 있다. • 예상하지 못한(Unexpected) 임상시험자 자료집(IB·Investigator’s Brochure) 또는 의약품의 첨부문서 등 이용 가능한 의약품 관련 정보에 비추어 약물 이상반응의 양상이나 위해 정도가 차이가 나는 경우를 의미한다. 여기서 중요한 것은 ‘예상하지 못한’의 기준이 임상시험자 자료집 기준이라는 것이다. 또한, 동일 계열 약물에서 잘 알려진 이상반응(class effect)이고 임상시험자 자료집에 기술되어 있다 하더라도 해당 임상약에서 실질적으로 발생되어 임상시험자 자료집에 업데이트 되기 전까지는 ‘예상하지 못한’ 이상반응으로 간주된다. • 중대한(Serious) 중대한 이상반응(Serious AE) 또는 중대한 약물이상반응(Serious ADR)이란 임상시험용 의약품 투약 후 발생한 이상반응 또는 약물이상반응 중 아래의 하나에 해당하는 경우로 정의된다. ① 사망하거나 생명에 대한 위험이 발생한 경우② 입원할 필요가 있거나 입원 기간을 연장할 필요가 있는 경우③ 영구적이거나 중대한 장애 및 기능 저하를 가져온 경우④ 태아에게 기형 또는 이상이 발생한 경우⑤ 그 밖에 의학적으로 중요한 상황 중대한 이상반응·약물이상반응의 경우, 그 말이 내포하는 바와 같이 환자의 안전에 중대한 영향을 미치는 사례들이다. 시험자는 중대한 이상반응이 발생한 경우 약과의 관련성과는 무관하게 24시간 이내에 의뢰자에게 알려야 한다. 의뢰자와 시험자는 환자가 회복되거나 더 이상 추적이 불가능할 때까지 중대한 이상반응의 경과를 추적·관찰해야만 한다. 또한, 임상시험 중 예상하지 못한 중대한 약물 이상반응(SUSAR)이 발생하는 경우 의뢰자가 해당 사실을 보고받거나 알게 된 날부터 15일 이내(사망 또는 생명을 위협하는 경우에는 7일 이내)에 규제기관에 해당 사례를 보고해야 한다. 한편, 중대성의 기준을 충족하지는 않지만 약물의 기전상 중요하다고 생각되는 이상반응들도 있다. 가령, 면역항암제 개발 시 면역 관련 이상반응, 또는 정맥주사 약물의 경우 투약 관련 이상반응 등은 위 중대성 기준과는 무관하게 의뢰자 입장에서 면밀히 검토해야 하는 이상반응으로 특별관심대상 이상반응(adverse event of special interest)이라 지칭한다. 일반적으로 이러한 이상반응은 임상시험계획서 내에 정의되고, 중대한 이상반응과 동일하게 연구자 인지 후 24시간 이내에 보고해야만 한다. 무엇을 해야 하나? 앞서 소개한 사례에서와 같이 임상시험 중 신약의 위해를 충분히 평가하고 이 특성을 파악하는 것은 환자의 안전·생명과 직결될 뿐만 아니라 해당 신약의 성공적 개발에도 매우 중요하다. 워낙 안전성 관련 규제가 강력할 뿐만 아니라 보고 기한이 지켜지지 않는 경우 행정처분 등 법적 조치가 있어 약물감시, 안전성 관리 등을 논할 때 안전성 보고에 초점이 맞춰져 있는 경우가 많다. 적절한 안전성 정보를 수집하기 위한 체계적인 보고는 매우 중요한 약물감시 활동의 한 축이지만, 이를 좀 더 확장해 임상개발 과정 중 지속적이고 체계적인 안전성 감시 활동이 반드시 필요하다. 이러한 안전성 감시는 보고받은 이상반응 정보를 검토하는 데 그치지 않는다. 안전성과 관련된 모든 정보, 즉 동물실험 또는 체외(in vitro) 실험, 임상적 또는 역학조사 결과, 비슷한 계열 약물의 학회 발표 자료, 문헌 정보, 외국 규제당국으로부터의 정보, 시판 후 보고서 등 다양한 출처로부터 얻은 안전성 정보를 면밀히 검토해야 한다. 예를 들어, 단백질 신약 A를 개발하고 있는데 우리 임상시험에서 수집된 정보에는 간독성과 관련된 특별한 징후가 보고된 바가 없는 반면, 최근 발표된 경쟁제품 B의 임상결과에서 중대한 간손상과 관련된 보고가 있었다고 가정해보자. 이러한 경우 신약 A에서도 비슷한 이상반응이 발생할 수 있을지에 대해 심각하게 고민해봐야 한다. 만약, 조금이라도 비슷한 이상반응이 발생할 수 있다고 판단이 된다면, 다음과 같은 조치들을 취할 수 있다.• 시험대상자 동의서에 간손상 가능성에 대한 정보를 포함하여 즉시 개정하고 환자가 인지할 수 있도록 한다. • 동물실험 또는 생체 외 연구를 통해 간손상 가능성에 대해 연구한다. • 간에 문제가 있는 환자들은 제외하고 등록한다. 환자를 스크리닝할 때 간기능과 관련된 지표들을 추가·강화할 수도 있다. • 임상시험 중 간손상과 관련된 지표들을 면밀히 모니터링해 환자 안전성을 담보할 수 있도록 한다. • 관련된 정보 및 조치사항들을 임상시험자 자료집, 임상시험계획서 등에 구체적으로 포함한다. 안전성 감시에 정보의 취합, 분석과 더불어 반드시 기억해야 할 한 가지가 더 있다. 바로 안전성 정보의 신속한 공유다. 신약 C의 2상 임상시험을 국내외 10개 기관에서 진행하고 있다고 치자. 한 기관에서 연구자가 투약 후 피부염 증상을 발견했다. 다만, 증상이 심하지 않고 약과 인과관계도 없다고 판단해 크게 눈여겨보지 않았다. 이 연구자의 경우 본인이 진료하는 환자의 정보만을 가지고 있기 때문에 정보가 제한적이지만 의뢰자의 경우는 다르다. 만약 이러한 피부염 증상이 10개 기관 중 8개 기관에서 나왔다면 어떨까. 연구자가 이 소식을 들었다면 아마 피부염이 발생했을 때 신약 C와 관련이 있다고 판단할 수 있다. 그러나 정보가 제때 공유되지 않으면 연구자들은 개별 사례를 보고 판단하기 때문에 중요한 안전성 정보를 놓칠 수 있다. 이는 비단 중대한 이상사례의 경우에만 해당되지 않는다. 의뢰자는 모든 이상반응의 발생 빈도, 트렌드 등을 분석하여 연구자와 긴밀히 교류하고, 더 나아가 지속적으로 비임상적·임상적 안전성 근거를 만들어놓아야만 한다. 신약의 임상적 이득과 위험의 저울질(trade-off) 앞에서 언급된 사례들은 외국에서 일어난 일이지만, 우리가 익히 잘 알고 있는 국내에서도 신약의 안전성으로 인한 임상 중단, 보고 누락으로 인한 사회적 이슈들이 빈번히 보도된다. 모든 물질은 독이므로 임상 단계에서 가벼운 정도부터 심각한 단계에 이르기까지 이상반응이 발생하는 것은 어쩌면 너무나 당연하다.한 건 한 건 발생하는 중대한 이상사례들을 면밀히 모니터링하고 분석하는 것은 분명 매우 중요한 일이다. 하지만 이에 더해 개발 신약의 전체적인 임상적 이득과 위험을 저울질하는 것 역시 필수다. 어찌됐든 임상적 이득이 위험을 상회할 경우에 한해 임상시험의 수행, 더 나아가 신약의 승인이 정당화될 수 있음은 자명하다. 국내 바이오 기업 헬릭스미스가 CAR-T치료제를 기술이전한 것으로 잘 알려진 미국 블루버드바이오에서 최근 희소식이 들려온다. 이 회사는 작년까지만 해도 개발 지연 등으로 인해 자금난에 시달리고 있었다. 그러나 회사의 미래를 결정하는 데 핵심으로 여겨졌던 렌티바이러스 기반 유전자치료제인 엘리셀에 대해 최근 미국 식품의약국(FDA) 자문위원회로부터 긍정적인 답변을 얻어내 청신호가 켜졌다. FDA 자문위원회는 ‘엘리셀을 초기 활동성 대뇌 부신백질이영양증 어린이 환자에게 치료제로 사용할 경우 이익이 위험보다 큰가’라는 질문에 15 대 0으로 만장일치 동의했다. 지난해 8월 엘리셀로 진행 중이던 임상 3상에서 예상치 못한 중대한 약물 이상반응(SUSAR)으로 골수형성이상증후군이 보고됐고 그 이후에도 추가로 2건의 사례가 보고됐지만, 그런 위험성에도 불구하고 이 희귀질환을 앓고 있는 어린이 환자에게 엘리셀의 임상적 이득이 크다고 본 것이다.그런 의미에서 오늘도, 내일도 우리는 끊임없는 저울질을 멈추지 말아야겠다. <저자 소개> 윤나리 성균관대에서 약학 박사학위를 받았다. 약사 출신으로 한미약품에서 임상개발 프로젝트 리더, IQVIA에서 전략 컨설턴트를 지냈다. 현재 지아이이노베이션 임상부문장을 맡아 신약 임상을 총괄하고 있다. 미국 MSD·아스트라제네카 등 글로벌 빅파마와 차세대 면역항암제 공동임상 계약을 맺는 데 주도적 역할을 했다.*이 글은 <한경바이오인사이트> 매거진 2022년 7월호에 실렸습니다.