'인간과 구분할 수 없다'…IT업계 들썩이는 GPT-4 뭐길래 [선한결의 IT포커스]
지난주부터 정보기술(IT)업계를 들썩이게 하는 소문이 하나 있습니다. 곧 세상에 공개될 예정인 차세대 초거대 인공지능(AI) 모델 GPT-4가 인간과 구분할 수 없을 정도로 고도화됐고, 기업 등의 도입 비용은 이전보다 훨씬 저렴할 것이란 얘기입니다.

IT업계 일각에선 GPT-4가 이미 튜링테스트를 통과했다는 이야기도 나옵니다. 튜링테스트는 컴퓨터가 얼마나 자연스럽게 인간과 소통할 수 있는지를 알아보는 테스트입니다. 아직은 AI 업계에서 튜링테스트를 '공식적으로, 확실히' 통과한 AI 모델이 없습니다(영국 레딩대의 '유진'에 대해선 후술하겠습니다).

GPT-4, 튜링테스트 통과?

15일 IT업계에 따르면 지난주께부터 업계에선 GPT-4가 튜링테스트를 통과했다는 이야기가 돌고 있습니다.

GPT-4는 일론 머스크 등이 세운 세계적인 AI 연구소 오픈AI가 개발 중인데요. 2020년 6월 GPT-3 공개 당시 2019년 2월 내놨던 GPT-2 대비 비약적인 기술 고도화를 이뤘던 만큼 이번에도 상당한 발전이 있을 수 있다는 게 업계의 중론입니다.
'인간과 구분할 수 없다'…IT업계 들썩이는 GPT-4 뭐길래 [선한결의 IT포커스]
AI 스타트업 보이저엑스의 남세동 대표는 한국경제신문과의 통화에서 "튜링테스트 통과가 공식 확인되지는 않았지만, 상당히 신빙성이 있는 얘기로 보인다"고 말했습니다.

오픈AI 최고경영자(CEO)의 최근 트윗도 이같은 소문이 맞다는 분위기입니다. 개발자 출신으로 오픈AI를 이끄는 샘 알트먼 오픈AI CEO는 지난 10일 "네가 만들어낸 '기술적 테러'에 대해 너무 자만하지 마라. 튜링테스트를 통과할 수 있는 능력도 '포스의 힘' 앞에선 무력하다"는 문구가 써진 이미지 한 장을 올렸습니다.
샘 알트먼 오픈AI CEO의 최근 트윗.
샘 알트먼 오픈AI CEO의 최근 트윗.
이는 영화 스타워즈 시리즈의 유명 캐릭터 다스베이더의 명대사를 패러디한 건데요. 한 AI 스타트업 대표는 "GPT-4가 튜링테스트를 무난히 통과했거나, 충분히 통과하고도 남을 만큼 성능이 높다는 것을 우회적으로 시사한 것"이라고 분석했습니다.

그는 "GPT-4가 실제로 튜링테스트 합격점을 받았다면 AI 업계를 비롯해 산업계 전반에서 충분히 '기술적 테러'로 여겨질 만큼의 영향을 줄 수 있다"며 "이 때문에 농담을 섞어 다스베이더 캐릭터를 차용해 글을 올린 것으로 보인다"고 덧붙였습니다.

GPT-4가 별다른 제한 조건 없이 튜링 테스트를 통과했다면 역사상 최초가 될 전망입니다. 기존에도 튜링 테스트를 통과했다고 주장한 AI 모델은 일부 있었는데요. AI 업계에선 "꼭 그렇지만도 않다"는 판정이 주를 이뤘습니다. 튜링테스트의 기준과 규칙이 명확하지 않다 보니 약간의 '사각지대'를 이용한 모델이 많았기 때문입니다.

2014년 영국 레딩대가 내놓은 AI 알고리즘 '유진'이 대표적인 예입니다. 영국 왕립학회 심사위원의 33%가 유진이 컴퓨터인지 인간인지 구분하지 못해 합격 기준인 30%를 처음 통과했는데요. 당시 레딩대는 심사위원들에게 이 알고리즘이 우크라이나 출신인 13세 소년 '유진 구스트만'이라고 주장했습니다. AI 알고리즘이 어색한 영어 답변을 내놓거나 대화의 맥락을 잘 짚지 못할 때도 심사위원들이 '외국 어린아이니까 그런가 보다'고 생각했던 이유입니다.

튜링테스트가 AI 기술의 절대적인 기준점은 아닙니다. 언어AI 테스트의 경우엔 AI가 문장을 제대로 이해해 문장 속 대명사를 정확히 번역하는지 따져보는 위노그라드 스키마 챌린지 등이 대안으로 나와 있습니다.
약 10년 전 나온 유튜브 채널 '에픽랩배틀즈오브히스토리(ERB)' 콘텐츠 중 한 장면. SF소설에 등장하는 AI컴퓨터 HAL9000이 '튜링테스트를 해보라'며 성능을 자랑하는 내용이다.
약 10년 전 나온 유튜브 채널 '에픽랩배틀즈오브히스토리(ERB)' 콘텐츠 중 한 장면. SF소설에 등장하는 AI컴퓨터 HAL9000이 '튜링테스트를 해보라'며 성능을 자랑하는 내용이다.
그림·영상 AI의 경우에도 대안 테스트들이 있습니다. 하지만 여전히 튜링테스트의 상징적 의미는 큽니다. 지금까지 가장 오래, 널리 알려진 AI 기술 테스트이기 때문입니다.

"이르면 12월 공개"

IT업계가 GPT-4를 주목하는 이유는 또 있습니다. 기존 GPT-3 모델보다 실제 상용 서비스 도입 문턱이 훨씬 낮아질 것이라는 전망 때문입니다. 그동안엔 막대한 비용과 인프라가 필요해 AI 기술을 쓰지 못했던 기업들도 GPT-4를 쓸 여지가 늘어난다는 예상입니다.

IT업계에 따르면 GPT-4는 공개 막바지 단계를 밟고 있습니다. AI산업분석기업 캠브리안AI리서치의 알베르토 로메로 가르시아 애널리스트는 최근 자신의 블로그를 통해 "오픈AI 안팎 여러 소식통의 이야기를 종합하면 GPT-4가 이르면 다음달, 늦어도 내년 1분기 중엔 출시될 전망"이라고 했습니다.

그에 따르면 GPT-4의 크기는 GPT-3와 비슷할 가능성이 높습니다. 파라미터 규모가 아니라 데이터 처리 최적화에 보다 집중했다는 설명입니다. 지금까지는 AI 기술 고도화와 모델 크기 확장이 함께 이뤄졌지만, 최근 들어 모델은 가벼우면서도 기능은 높이는 경량화 필요성이 곳곳에서 제기된 영향으로 풀이됩니다.

GPT-4는 모델 학습에 필요한 비용도 기존 대비 적을 전망입니다. 가르시아 애널리스트는 "GPT-4의 학습비용은 GPT-3에 비해 현격히 낮을 전망"이라며 "오픈AI가 소프트웨어 단계 효율화나 보다 빠른 연산 칩을 활용하는 등을 통해 AI 학습 비용 절감안을 찾은 것으로 보인다"고 썼습니다.

서비스 종류와 규모 등에 따라 다르지만, GPT-3는 학습 단계에서만 1회당 수십억원이 드는 것으로 알려져 있습니다. 그간 대기업들도 GPT-3 기반 일반 사용자용 AI 서비스를 쉽사리 내놓지 않았던 이유입니다. 국내에선 SK텔레콤의 개인용 AI 서비스 '에이닷' 정도가 GPT-3를 기반으로 하고 있습니다.

가르시아 애널리스트에 따르면 GPT-4는 회당 학습 비용이 100만달러(약 13억원) 이하로 떨어질 전망입니다. 한 ICT 기업 관계자는 "그간 알려진 이야기가 모두 사실이라면 내년 중엔 이용자가 사람과 얘기하는지, 컴퓨터와 얘기하는지 모를 정도로 자연스러운 챗봇 서비스 등이 여럿 나올 수 있을 것"이라며 "이를 기반으로 실생활에 쓸 수 있는 개인화 AI 서비스가 많아질 수 있다"고 내다봤습니다.

선한결 기자 always@hankyung.com