개발만 하는 한국형 챗GPT…격차는 저 멀리

<앵커>

챗GPT가 출시한 지 불과 4개월 만에 업그레이드된 GPT4가 출시됐습니다.

국내에서도 한국형 챗GPT를 개발하고는 있지만 격차는 점점 벌어지고 있다는 분석이 나옵니다.

자세한 내용, 취재기자와 이야기 나눠보겠습니다. IT바이오부 정호진 기자 나와 있습니다.

정 기자, 금세 GPT4가 출시됐습니다. 이전에 비해 뭐가 나아진 겁니까?

<기자>

한마디로 표현하면 더 똑똑해졌습니다. 더 많은 글자를 읽고도 더욱 정확한 답변을 제시할 수 있게 된 건데요.

오픈AI는 하위 10%였던 변호사 시험 성적이 상위 10%까지 수직상승했고, 답변 정확도와 이해 가능한 글자 수도 크게 늘었다고 말했습니다.

무엇보다 눈에 띄는 건, 글만 읽을 줄 알았던 챗GPT가 그림도 볼 수 있게 된 건데요.

많은 풍선이 달려있는 그림을 보여주며 '줄을 자르면 어떻게 될까?'라고 물어봤더니 "하늘로 날아갈 것"이라고 답했는데요.

이는 AI가 그림 속 상황을 정확히 이해할 뿐만 아니라, 공기보다 가벼운 물체는 떠오른다는 개념까지 유추할 만큼 성능이 뛰어나단 겁니다.

그리고 MS 오피스와의 협업 소식도 충격이었습니다.

파워포인트에 "이 파일을 바탕으로 발표 자료를 만들어줘"라고 하면 보시는 것처럼 자료가 뚝딱 만들어집니다.

그리고 엑셀에서도 작성된 데이터를 바탕으로 데이터를 해석해주고, 그래프로 만들어주는 기능도 선보였습니다.

<앵커>

미래가 생각보다 빠르게 다가오고 있습니다. GPT4에 대항해서 국내 빅테크들도 언어 모델을 개발해오지 않았습니까?

최근 소식이 뜸한데, 격차가 벌어지고 있는 것 같습니다.

<기자>

그렇습니다.

시작은 일 년이었습니다. 오픈AI가 지난 2020년 GPT-3 논문을 공개했고, 네이버와 카카오는 이듬해 각각 자체 개발한 모델을 발표했습니다.

그리고 챗GPT가 지난해 11월에 출시됐고, 4개월 만에 GPT-4가 출시됐습니다. 하지만 네이버는 오는 7월에나 하이퍼클로바X를 선보일 계획입니다.

카카오는 지난 일요일, KoGPT 기반의 '다다음'의 초기 버전을 선보였지만 이용자가 폭주했다는 이유로 이틀 만에 서비스를 중단했습니다.

<앵커>

개발에 투입되는 비용 규모도 차이가 있다 보니, 격차가 점점 벌어지는 것 같습니다.

그렇다면 모델 간의 성능 차이는 어떻습니까?

<기자>

방금 말씀드린 세 가지 모델을 비교해보면, GPT-3에 비해 네이버의 언어모델이 매개변수가 300억 개가량 많은 걸 보실 수 있는데요.

매개변수가 많다는 건 그만큼 AI가 공부를 많이 하고, 정확한 답변을 제공하기 위한 근거가 많아진다는 의미입니다.

때문에 개발자들도 '다다익선'이라고 말하긴 하지만, 매개변수가 많다고 반드시 성능이 더 뛰어나진 않습니다.

GPT-4도 매개변수가 공개되진 않았지만, 큰 차이는 없을 것이란 목소리가 많은데요.

예를 들어 설명 드리자면, 문제집을 전부 푼다고 해서 수능 만점을 받을 수 있는 건 아니잖아요?

양도 중요하지만 어떻게 공부하느냐가 더 중요하듯, AI도 변수를 어떻게 수정하고, 최적화하느냐에 따라 성능도 천차만별입니다.

다만 이 과정이 기밀 사항이기 때문에, 일반적인 모델로 흉내를 내려고 해도 GPT4만큼의 품질이 나오긴 어렵다는 게 업계의 설명입니다.

취재 도중 들었던 표현 중에는 "모델의 품질 차이는 절대 따라잡지 못할 것이라고 본다"는 극단적인 표현도 있었습니다.

<앵커>

성능에서 차이가 있더라도 우리말에 특화됐다는 장점을 내세웠었는데, 이 점은 어떻습니까?

<기자>

뤼튼이나 아티피셜소사이어티처럼 국내에도 많은 스타트업들이 생성형 AI를 기반으로 다양한 서비스를 제공 중인데요.

이 스타트업들도 우리말 서비스를 제공하지만, GPT4 모델을 사용하고 있습니다. 그만큼 우리말에 특화됐다는 장점도 옅어지고 있다는 방증입니다.

챗GPT 출시 초기만 해도 '영어는 잘 하는데 한국어가 서툴다'는 얘기가 있었는데요. 이젠 GPT4의 한국어 실력도 과거 영어만큼이나 높아졌습니다.

한 글로벌 VC 관계자는 "국내에서 개발한 언어 모델이 한국어를 더 잘한다는 말에 동의하는 사람은 많지 않을 것"이라고 말하기도 했습니다.

<앵커>

그렇다면 국내 모델이 지닌 장점은 없는 겁니까?

<기자>

모델의 성능을 떠나서, 비용적인 측면에서만큼은 국내 모델이 더 효율적인 것으로 나타났습니다.

'GPT'와 같은 언어 모델은 자체적으로 학습한 데이터를 사람의 언어로 바꾸는 과정을 거치는데요.

예를 들어볼까요? '나는 학교에 간다'라는 문장을 보면, 해외 모델은 각 단어로 바꿔주는데 국내 모델은 문장을 의미 단위로 본다는 겁니다.

또한 챗GPT는 영어에 최적화된 모델인 만큼, 같은 길이의 답변도 영어에 비해 한글로 바꿀 때 5배가량 더 비싸지만, 하이퍼클로바는 한국어에 최적화됐다는 게 장점입니다.

한 AI 스타트업 대표는 "하이퍼클로바에선 한국어가 영어의 절반 비용"이라며 "하이퍼클로바X의 성능이 나쁘지 않다면 하이퍼클로바를 사용할 것"이라고 말했습니다.

또한 카카오의 저비용 고효율 전략도 투자적인 관점에선 긍정적이라는 분석도 나옵니다.

홍은택 카카오 대표는 지난 실적발표를 통해 KoGPT의 강점으로 비용 효율성을 꼽기도 했는데요.

증권업계 관계자는 "엄청난 비용을 투자해 실패하는 것보다 가성비 전략의 성공에 따른 매출 성장이 가산점을 부여받을 것"이라고 설명했습니다.

<앵커>

여기까지 듣겠습니다. IT바이오부 정호진 기자였습니다.

정호진기자 auva@wowtv.co.kr