외신 "구글, AI 챗봇 개발사 앤스로픽에 4억달러 투자"
스펠북, 클로드·챗GPT 비교 분석
'출처' 기능 유무가 차별점
구글-앤스로픽 vs MS-챗 GPT, AI 전쟁 본격화
전 세계 인공지능(AI) 돌풍을 일으키고 있는 오픈AI의 챗봇 서비스 '챗GPT'에 강력한 경쟁자가 등장했습니다. 바로 구글이 파트너십을 체결한 미국 AI 스타트업 앤스로픽이 테스트하고 있는 '클로드(Claude)'입니다. 클로드는 아직 대중에 공개되지 않았지만, 프로그램 언어 솔루션 '스펠북'을 운영하는 스케일의 연구팀이 두 챗봇을 비교한 내용을 자사 홈페이지에 공개했습니다. 이를 기반으로 챗 GPT와 클로드의 특징과 강점을 한경 긱스(Geeks)가 살펴봤습니다.
(사진=게티이미지뱅크)글로벌 빅테크의 '생성형 인공지능' 경쟁이 뜨겁다. 생성형 AI란 사용자의 요구대로 몇 초 만에 텍스트와 예술작품을 생성할 수 있는 AI 기술을 말한다. 지난 3일(현지 시각) 파이낸셜타임스(FT)가 구글이 AI 챗봇 '클로드(Claude)를 테스트하고 있는 스타트업 앤스로픽에 4억달러(약 5000억원)를 투자했다고 보도했다. 클로드는 아직 대중에 공개되지 않았지만, 오픈AI가 지난 12월 공개한 AI 챗봇 '챗 GPT'의 강력한 경쟁자로 알려졌다.
챗GPT 개발자가 만든 앤스로픽
앤스로픽은 대니엘라 애머데이와 다리오 애머데이 남매가 2021년 미국 샌프란시스코에 공동 설립한 AI 스타트업이다. 이 회사는 'AI 안전성(Safety)을 모토로 한다.
대니엘라 애머데이 앤스로픽 회장은 오픈AI에서 안전성과 정책 문제를 감독했으며, 다리오 애머데이 최고경영자(CEO)는 오픈AI에서 리서치 부사장(VP)을 맡아 챗 GPT 개발을 이끌었다. 두 사람은 AI의 방향성에 의견이 맞지 않아 오픈AI를 떠나 앤스로픽을 창업했다.
앤스로픽은 지난달 오픈AI의 챗 GPT와 경쟁하기 위해 '클로드(Claude)'라는 새로운 챗봇의 테스트 버전을 출시했다. 클로드는 아직 대중에게 공개되지 않았다. 회사는 몇 달 안에 챗봇 서비스에 접근할 수 있을 것으로 밝혔다.
컴퓨터 언어 모델 솔루션 '스펠북'을 운영하는 스케일의 연구팀은 두 AI 챗봇을 비교 분석한 결과를 지난달 17일 자사 홈페이지에 공개했다. 스펠북팀은 "클로드는 '헌법 AI' 원칙 때문에 부적절한 요청을 거부하는 경향이 있고 챗 GPT보다 더 재미있다"고 총평했다. 하지만 "코드 생성이나 추론 능력에서는 챗 GPT가 클로드보다 낫다"며 "계산 능력은 대체로 비슷하다"고 덧붙였다.
챗 GPT는 질문에 답하고 사람처럼 들리도록 만들어진 비서다. 반대로 클로드는 자신에 대해 좀 더 많은 것을 말한다. 스펠북팀은 "간결하게 요점을 잘 정리하는 챗 GPT에 비해 클로드는 답변이 좀 더 장황하지만 그래서 더 자연스럽고 일관성이 있다"고 설명했다.
가장 큰 차별점은 '출처' 기능의 유뮤다. 클로드는 질문의 답변이 끝나면 말미에 '편집(edit)'이라는 문구와 이모지가 붙는다. 스펠북팀은 "클로드는 답변을 누가 만들어냈는지를 이해하고 있는 것 같다"고 설명했다. 위키피디아처럼 클로드가 답변에 인용한 출처를 사용자들이 볼 수 있을 것으로 예상된다.
한 한국과학기술원(KAIST) 대학원생은 "챗 GPT가 논문의 영문 초록은 거의 완벽하게 만들어내기 때문에 많이 쓰인다"며 "구글의 AI 챗봇이 답변의 '출처' 기능을 내놓으면 연구자들이 논문 쓰기가 훨씬 수월해질 것"이라고 기대했다.
재밌는 클로드 vs 코딩 잘하는 챗GPT
클로드의 유머 실력은 얼마나 될까. 스펠북팀은 "클로드는 챗 GPT보다 코미디에 훨씬 뛰어나지만, 여전히 인간 코디미언과는 거리가 멀다"고 평가했다. 실제 트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해달라는 질문에 클로드는 농담을 잘 만들어냈지만, 챗 GPT는 재미있는 농담을 생성할 수 없었다.
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해 달라는 질문에 농담을 생성해낸 클로드./ 출처: 스케일
트위터 유료 서비스인 '블루 체크'를 비판하는 농담을 '세인필드'(1990년대 미국 코미디 시트콤) 방식으로 작성해달라는 질문에 농담을 생성하지 못한 챗 GPT./ 출처: 스케일코드 생성 능력은 어떨까. 파이선(컴퓨터언어) 모듈 생성 능력을 비교한 결과, 챗 GPT는 알고리즘을 쉽게 작성할 뿐만 아니라 타이밍 코드도 정확했다. 하지만 클로드는 평가 코드에서 실수가 나왔다. 'FuzzBuzz'를 출력하는 코딩 문제를 냈더니 챗 GPT는 5번 시도 중 4번 성공했지만, 클로드는 다섯번 모두 실패했다.
보험 계리사 시험에 나오는 수학 문제는 두 챗봇 모두 성공하지 못했지만 챗 GPT가 좀 더 나은 답변을 내놨다. 기사 요약은 챗 GPT와 클로드 모두 잘 해냈다.
AI 윤리 강조하는 클로드
앤스로픽은 클로드가 '헌법 AI'라는 기술 준칙을 따르고 있다고 강조한다. 인종차별이나 성희롱, 불법적인 내용에 대해 클로드가 답변을 꺼리는 경향을 보이는 이유다.
클로드에 헌법 AI를 물으면 "헌법 AI의 목표는 AI 시스템이 인류에 유익하고 무해하고 정직하도록 유지하는 것"이라고 답변한다. 다시 말해 "AI 시스템이 인간의 가치에 맞추고 이를 따르도록 훈련해, 인류를 돕고 유익이 되도록 설계하는 것"이다.
클로드는 헌법 AI의 구체적인 기술을 밝히진 않지만, 자기지도 학습과 다른 AI 안전성 방법론을 이용해 행동을 제약하거나 어떤 행동에 보상을 주는 방식을 이용한다고 설명한다.
구글 vs MS, AI 전쟁 본격화
구글은 외신 보도의 앤스로픽 투자에 대해 언급하진 않았지만, 지난 3일 앤스로픽이 구글의 클라우드 컴퓨팅 서비스를 사용하는 파트너십을 맺었다는 내용을 별도로 발표했다. 토마스 쿠리안 구글 클라우드 CEO는 "구글 클라우드는 차세대 AI 스타트업을 위한 개방형 인프라를 제공하고 있으며 앤스로픽과의 파트너십은 사용자와 기업이 신뢰할 수 있는 책임감 있는 AI의 힘을 활용하도록 돕는 방법을 보여주는 좋은 예"라고 말했다.
수능에서는 그동안 인공지능(AI) 관련 문제가 제대로 나오지 않았습니다. 하지만 수능은 시대 변화상을 반영하는 만큼 관련 내용이 언제든 출제될 수 있습니다. AI의 역사, 기술적 개념, 의미 등에 대한 내용을 알고 있다면 실전에 큰 도움이 될 것입니다. 수능에서는 기존에 출제되지 않은 생소한 개념이 등장할 땐 개념 설명 지문이 나오는 사례가 많습니다.수능 3등급 받은 AI특히 최근에는 챗GPT라 불리는 대화형 AI 챗봇이 등장해 산업계를 뒤흔들고 있습니다. 오픈AI라는 회사가 만든 AI인데요. 1조 개 단어가 포함된 1750억 개의 매개변수를 사용한다고 합니다. 올해 상반기 매개변수가 100조 개인 차기작도 나온다고 합니다. 이 AI는 단순히 대화만 할 수 있는 게 아닙니다. 어떤 정보를 간결한 문장으로 제시하고, 특정 개념을 설명합니다. 아이디어를 내거나 시를 짓기도 하고, 에세이까지 씁니다. 챗GPT에게 수능을 보게 했더니 3~4등급 수준이 나왔다는 실험도 있습니다. AI 기술의 특이점이 오고 있다는 이야기겠지요.AI의 역사AI는 1950년대부터 학계에서 논의됐지만, 본격적인 발전은 2006년 제프리 힌턴 교수가 딥러닝(deep learning) 알고리즘 개발에 성공하면서 시작됐습니다. 딥러닝은 컴퓨터 스스로 외부 정보를 조합, 분석해 학습하는 기능인데요. 명령어를 분석해 결과를 도출해내던 기존 기계적 방법에서 나아가 컴퓨터 스스로 정보를 찾고 이해할 수 있는 단계입니다.2014년 AI 연구원인 이언 굿펠로는 GAN(Generative Adversarial Network)이란 방식의 딥러닝 방법을 발명해 또 한번의 혁신을 이뤄냅니다. 생성적 적대 신경망이라 불리는 이 방식은 특정 이미지를 생성하는 모델과 이 모델에서 만든 이미지를 판별하는 모델이 끊임없이 대립하면서 발전한다는 개념이죠.예를 들어 위조지폐범(생성모델)이 진짜 지폐와 비슷한 위조지폐를 만들어 경찰(판별모델)을 속인다고 가정해볼까요. 속이려는 자와 속지 않으려는 자, 둘이 대립하다 보면 어느 순간 경찰이 진짜와 가짜를 구별하기 힘든 수준까지 발전하게 될 겁니다. 이 딥러닝을 이용하면 윤곽만 대충 그려도 그럴듯한 그림을 만들어낼 수 있게 됩니다.AI 기술의 미래AI 기술은 앞서 언급한 챗GPT 같은 초대규모 언어모델로 또 한번의 변혁을 맞이합니다. 이 모델은 사용자 피드백 기반 강화학습을 사용합니다. 사람이 챗GPT가 만들어낸 결과물에 점수를 매기면, 이를 알고리즘에 반영해 챗GPT 스스로 잘한 결과물에 점수를 주도록 하는 것이죠. 챗GPT와 대화할 때 기계라는 느낌을 거의 받지 않는 이유가 바로 여기에 있습니다. 사람이 쓴 것 같은 글쓰기가 가능하고, 작곡까지 마음대로 할 수 있는 건 이 같은 학습 방식의 결과죠.AI 기술의 발전은 AI 시장이 커질수록 가속도가 붙습니다. 초대규모 데이터를 학습해 처리할 수 있는 매개변수가 많아질수록 AI도 점점 똑똑해지기 때문이죠. 앞으로는 단어 중심의 인터넷 검색 방식 역시 완전히 달라질 것입니다. 예를 들어 ‘이번 여름에 유럽여행 가려는데 계획 좀 짜줘’라고 검색하면 각 개인의 취향과 일정을 고려해 검색 결과를 도출하고, 필요시 이미지도 자체적으로 생성해 보여주는 것이죠.그러면 AI가 사람을 대체하는 시대가 정말 오는 걸까요? 전문가들은 그렇게 보지 않습니다. 챗GPT가 질문에 답을 내놓기는 하지만 원리를 완벽히 파악하는 것은 아니죠. 어떤 문장이 좋을지 확률적으로 학습된 결과를 내놓는 것입니다. 결국 그 논리구조가 맞는지, 전제가 참인지 여부는 분석자가 결정해야 합니다. 우리가 경쟁해야 할 것은 AI 자체가 아니라 AI를 잘 활용할 수 있는 개개인이라는 얘기가 나오는 이유죠. AI를 활용하는 사람과 활용하지 못하는 사람 간 업무 효율이나 정보 비대칭성이 더 커질 수밖에 없기 때문입니다. 스마트폰을 다룰 수 있는 사람과 못 다루는 사람의 정보 습득량 차이를 생각해보면 이해가 쉽습니다.고윤상 한국경제신문 기자NIE 포인트1. AI 기술은 어떻게 발전해왔을까?2. AI는 어떻게 질문에 답변하는 걸까?3. AI가 사람의 역할을 대체하게 될까?
기술검증 기관 애나는 연세대 인공지능대학 김시호 교수 연구팀과 함께 인공지능(AI) 챗봇 챗GPT에 2023학년도 대학수학능력시험(수능) 영어와 수학 과목을 풀어보게 한 결과 각각 2등급, 낙제 수준의 성적을 보였다고 6일 밝혔다.이번 실험은 수능 문제에서 그림이 포함돼 문항 입력이 불가능한 경우를 제외하고 문제 전체를 입력하고 답을 확인하는 방식으로 진행됐다.영어 수능 시험에서 듣기 평가의 경우 16문제 중 14문제, 독해 평가는 17문제 중 13문제에 정답을 맞춰 총 82점을 취득했다. 수능 2등급 수준 성적이다. 문단에 함축된 의미 추론, 요지 파악, 글의 목적과 주제 파악 등 난이도가 높은 문제에서 모두 정답을 맞췄다.반면 수학 시험에서는 상반된 결과가 나왔다. 공통 과목 분야에서는 20문제 중 6문제에 정답을 맞췄으나 확률과 통계·미적분학·기하 분야 문제는 전부 오답을 출력해 챗GPT의 수학 능력은 현저히 낮은 것으로 나타났다. 기계학습 방법으로 수학을 배우는 챗GPT의 연산 능력은 한 자리 숫자의 곱셈 정도는 풀지만 두 자리 숫자의 곱셈에서 오답을 낼 정도로 정확도가 떨어진다.이상호 애나 최고기술책임자(CTO)는 "챗GPT는 문장에 대한 요약, 추론 등에 대해서는 매우 뛰어난 능력을 보이고 있으며 이러한 요약, 추론 기능을 활용해 응용할 수 있는 서비스가 무궁무진할 것으로 보인다"며 "산업계에서는 인재 채용에 대한 요구사항이 머지않아 바뀌게 될 것"이라고 말했다.한경희 연세대 공학교육혁신센터 교수는 "멀지 않은 미래에 AI의 능력이 대학 신입생의 학습 능력 수준을 넘어서게 될 것"이라며 "AI와 동행하게 될 앞으로의 교육에서 새로운 교육 목적과 방법을 고민하지 않는다면 미래사회에서 대학 교육은 존립의 근거를 잃게 될지도 모른다"고 지적했다.조아라 한경닷컴 기자 rrang123@hankyung.com
신한투자증권은 6일 네이버에 대해 경기 침체에도 광고·커머스 부문 호조로 수익성 유지가 가능할 것으로 전망된다고 평가했다. 이에 목표가를 기존 24만원에서 25만원으로 상향 조정했다. 투자의견은 '매수'를 유지했다. 네이버는 작년 4분기 매출 2조2717억원, 영업이익 3365억원을 기록했다. 전년 동기 대비 매출은 17.8%, 영업이익은 4.2% 감소한 수치로 영업이익은 시장추정치(3461억원)를 밑돌았다. 디스플레이광고(DA) 부문의 부진 영향이 컸다는 분석이다. 비용의 경우 인건비는 채용속도 조절, 마케팅비는 웹툰 프로모션 축소로 과거 대비 통제되는 모습을 보였다는 평가다. 파트너비는 월드컵 중계권, 웹툰 회계 처리 변경 효과가 반영됐다고 신한투자증권은 말했다.강석오 신한투자증권 연구원은 목표주가 상향에 대해 "비용 통제 계획이 예상보다 빠르게 진행돼 비용 추정치를 수정했다"며 "포쉬마크 편입 및 지분가치 변동도 반영했다"고 설명했다. 이어 "경기 침체기에도 검색광고 및 커머스의 방어력으로 수익성 유지가 가능할 것으로 전망된다"면서도 "최근 신흥국 플랫폼 섹터에 자금유입 및 인공지능(AI) 기술 부각으로 인한 주가 상승으로 상승 여력은 감소했다"고 진단했다. 신현아 한경닷컴 기자 sha0119@hankyung.com