제미나이에 밀리나 싶더니…한달만에 새버전 내놓은 오픈AI
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
11일(현지시간) 오픈AI에 따르면 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 출시했다. GPT-5.2는 이전의 즉답(Instant), 사고(Thinking), 프로 모드 등 세 가지 모드로 구성됐다.
즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다. 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구다.
전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록했다. 제미나이 3프로의 76.2%를 넘어섰다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없다. 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.
별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.
환각(Hallucination) 현상도 크게 줄였다. 내부 테스트 결과 GPT-5.2 사고 모드의 오류율은 6.2%로 전작인 GPT-5.1 사고 모드(8.8%)와 견줘 약 30% 감소하는 등 신뢰도가 높아졌다. 긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.
GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다. 새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.
오픈AI가 불과 한 달 간격을 두고 챗GPT 새 버전을 내놓은 것은 지난 2022년 챗GPT 서비스를 시작한 이래 처음 있는 일이다. 오픈AI는 당초 GPT-5.2를 월말에 내놓으려 했지만, 제미나이3 프로가 강력한 벤치마크 성적표를 앞세워 이용자 몰이를 하는 것을 보고 출시를 앞당긴 것으로 전해졌다.
이송렬 한경닷컴 기자 yisr0203@hankyung.com
ADVERTISEMENT
ADVERTISEMENT