제미나이에 밀리나 싶더니…한달만에 새버전 내놓은 오픈AI

이송렬

입력2025.12.12 07:13 수정2025.12.12 07:13

챗GPT 개발사 오픈AI가 이전 버전을 내놓은 지 불과 한 달 만에 새 버전을 내놨다.

11일(현지시간) 오픈AI에 따르면 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 출시했다. GPT-5.2는 이전의 즉답(Instant), 사고(Thinking), 프로 모드 등 세 가지 모드로 구성됐다.

즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다. 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구다.

전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.

소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록했다. 제미나이 3프로의 76.2%를 넘어섰다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없다. 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.

별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

환각(Hallucination) 현상도 크게 줄였다. 내부 테스트 결과 GPT-5.2 사고 모드의 오류율은 6.2%로 전작인 GPT-5.1 사고 모드(8.8%)와 견줘 약 30% 감소하는 등 신뢰도가 높아졌다. 긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.

GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다. 새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.

오픈AI가 불과 한 달 간격을 두고 챗GPT 새 버전을 내놓은 것은 지난 2022년 챗GPT 서비스를 시작한 이래 처음 있는 일이다. 오픈AI는 당초 GPT-5.2를 월말에 내놓으려 했지만, 제미나이3 프로가 강력한 벤치마크 성적표를 앞세워 이용자 몰이를 하는 것을 보고 출시를 앞당긴 것으로 전해졌다.

이송렬 한경닷컴 기자 yisr0203@hankyung.com

이송렬 기자

안녕하세요. 한경닷컴 이송렬입니다.

증권, 금융 등 분야를 거쳐 지금은 부동산 관련 기사를 취재하고 있습니다.

우리 동네 집값은 왜 오르고 내려갔는지, 시장에서 나오는 뒷얘기 등 독자분들에게 유익한 기사를 쓰겠습니다.

많은 제보 부탁드립니다.

yisr0203@hankyung.com

관련 뉴스

1

오픈AI "AI가 업무 하루 1시간 줄여…추론토큰 사용량 320배↑"

오픈AI가 인공지능(AI)을 활용하면 업무시간을 하루 평균 1시간가량 절약하는 효과를 볼 수 있는 것으로 나타났다는 보고서를 냈다. 기업용 서비스인 '챗GPT 엔터프라이즈'를 비롯해 소비자기업간거래(B...
2

여친에게 사과 메시지 보냈다가 '식겁'…'카톡 대참사' 무슨 일? [이슈+]

"그렇게 느낄 수도 있겠다 미안해. 나도 진짜 같이 준비하는 게 좋고 너랑 이런 얘기 나누는 게 설레는데, 내가 표현을 잘 못해서 너만 한다는 느낌 들게 한 것 같다.우리 여행 준비하는거 부터가 이...
3

엔비디아 CFO "오픈AI에 1000억달러 투자, 아직 확정 안돼"

엔비디아가 챗GPT 개발사 오픈AI와 추진 중인 1000억달러(약 147조원) 규모의 인공지능(AI) 인프라 투자 계약이 아직 성사되지 않은 것으로 나타났다.2일(현지시간) 로이터통신에 따르면 미국 애리조나주에서 열...