[뉴스의 맥] 스스로 학습하는 '초거대 AI' 인류 문명 바꾸나

인간 뇌 구조 닮은 AI…상용화 길 열렸다

초대형 인공신경망 갖춰 종합적 사고…학습 방식 '대격변'
문장 입력하면 한 번도 본 적 없는 이미지 상상해 그려내
공장 기계 장애 예측하고 불량 원인 찾아 직접 고치기도
인간흉내 수준 '디지털 휴먼' 넘어선 '메타 휴먼' 나올 것

배경훈 < LG AI연구원 원장·한경 AI경제연구소 자문위원 >
인류 역사에서 가장 위대한 발명품은 무엇일까? 증기기관, 전구 등 혁신적인 발명품 중에서 문자의 발명은 항상 최상위에 자리한다. 문자는 인간의 지식을 표기하는 핵심 도구다. 15세기에는 금속활자를 만나 소수에게만 허락됐던 지식을 종이 문서의 형태로 대중에게 전파함으로써 인간을 계몽하는 원동력이 됐다. 그 이후 20세기 말 등장한 컴퓨터와 인터넷은 문자로 기술된 모든 인간의 지식을 전자 문서의 형태로 변환시켰고, 시공간의 제약 없이 인간의 지식을 축적하고 전파하는 전기가 됐다.

이런 전자 문서의 폭발적인 증가와 더불어 21세기에는 심층 신경망 기반의 기계 학습인 딥러닝이 구현 가능해짐에 따라 인공지능(AI)은 급속도로 발전되기 시작했다. 2015년과 2018년 구글이 발표한 AI는 각각 시각 및 언어 분야에서 인간의 지식을 이해하는 수준이 인간을 초월했다. 인간보다 훨씬 더 빠르고 정확하게 대량의 전자 문서에서 답을 찾거나 다량의 이미지를 판독하는 분야에 일대 혁신을 가져왔다. 이런 AI는 현재 질병진단, 자율주행, 화성탐사 등 공상과학 영화에서나 가능한 일들을 척척 수행해 내고 있다.

데이터 레이블링·추가 학습이라는 제약

만능처럼 보이는 딥러닝 기반의 현재 AI는 사실 두 가지 큰 약점이 있다. 첫째, 일일이 정답을 표기하는 레이블링 작업이 완료된 데이터를 훨씬 더 많이 필요로 한다는 점이다. 예를 들면 수만 시간에 달하는 자동차 주행 영상을 촬영한 뒤 해당 영상 내 존재하는 신호등, 보행자 등 다양한 객체의 위치 및 종류를 인간이 모두 표시해야 한다. 글로벌 컨설팅회사 액센츄어에 따르면 1시간의 주행 영상을 준비하기 위해서는 평균 800시간이 걸린다고 한다. 학습 데이터 준비에 훨씬 더 많은 인간의 노동력을 요구하고 있다.

두 번째는 적용 분야별 추가 학습이 필요하다는 것이다. 가령 위키피디아에 존재하는 수많은 전자 문서를 학습한 기계독해 AI를 장착한 챗봇은 일반적인 질문에는 잘 대답할 수 있다. 하지만 은행 업무에 관련된 질문에는 답변하기 어렵다. 따라서 은행 업무와 관련한 다량의 전자 문서를 추가로 준비해 학습하는 과정이 필요하다. 법률 상담 등 다른 영역에 적용하고자 할 경우 추가 학습이 또다시 요구된다. 데이터 레이블링과 추가 학습이라는 제약사항이 딥러닝 기반 AI의 확대 적용을 가로막는 결정적인 장애물인 것이다.

GPT-3, AI 범용화 길 열어

2020년 오픈(Open)AI에 의해 발표된 GPT-3는 이런 약점을 극복하기 위한 실마리를 제공했다. GPT-3는 인간의 뇌만큼 인공신경망의 크기를 늘리면 앞서 언급한 두 가지 약점이 해결될 것이라는 기대에서 출발했다. 인간의 뇌에서 뉴런 간 정보 전달의 통로인 시냅스와 비슷한 역할을 수행하는 인공신경망의 파라미터(parameter·매개변수)를 1750억 개까지 늘린 것이다. 인공신경망의 크기가 2017년 AI2의 ELMo 대비 약 1860배 폭증했다. 사뭇 거대해 보이는 GPT-3도 100조 개 수준의 인간 시냅스에 비해서는 아직 소규모인데 파라미터 수를 늘릴수록 정확도가 높아지기 때문에 향후 더욱 거대해질 것이다.

GPT-3는 사전 학습 시 데이터에 대한 별도의 레이블링 작업이 필요 없다. 예를 들면 현재 AI 의사는 질병의 위치와 병명이 일일이 표기된 수백만 장의 엑스레이 사진이 필요한 반면 GPT-3는 일반 엑스레이 사진과 진료 소견만으로도 질병을 진단할 수 있다. 또 간단한 추가 학습(퓨샷 러닝)만으로 바로 적용이 가능해 AI의 범용화에 크게 기여할 것으로 판단된다. 은행, 전자상거래 등 서로 상이한 분야의 고객 상담 챗봇을 개발할 때마다 반복되는 추가 학습 과정을 대폭 줄일 수 있는 것이다. AI의 학습 방식에서 대격변 수준의 변화가 예상된다.이런 초거대 AI는 기존 AI에서는 불가능했던 종합적인 추론이 가능할 것으로 보인다. 그림 속 의학 분야 예시처럼 GPT-3는 사전 학습 시 대량의 데이터 내 존재하는 다양한 상관관계를 이해하고, 이를 바탕으로 종합적인 사고가 가능하다는 것을 증명했다. 그 외 번역, 회계, 법률 등 다른 분야에서도 동일한 성능을 보이고 있어 세계의 이목을 집중시키고 있으며 검색산업의 지각 변동을 예고하고 있다.

초거대 AI는 기존 AI의 한계를 뛰어넘어 창작의 영역까지 도전하고 있다. 최근 발표된 OpenAI의 DALL-E는 다양한 이미지와 각각의 이미지를 자연어로 설명하는 텍스트 데이터를 기반으로 학습한 AI다. 학습이 완료된 DALL-E에 서술형 텍스트만 입력하면 관련된 이미지를 생성한다. 추가 학습이 필요 없을 뿐만 아니라 학습 시 한 번도 본 적 없는 이미지도 생성해낸다. 생성 측면에서 특이점 초입 단계에 진입한 것으로 거론되고 있다.

스스로 의사결정 내리는 초거대 AI

종합적인 추론이 가능한 초거대 AI는 스스로 의사 결정을 하는 단계까지도 발전할 것으로 예상된다. 예를 들면 제품 생산 공장에서 발생한 모든 이슈와 해결책이 기록된 모든 엔지니어 문서를 학습한 초거대 AI는 수만 대 생산 기계의 장애를 예측해 예방 정비를 단행할 수 있다. 더 나아가 지속적으로 완제품의 불량을 일으키는 원인을 파악해 관련 공정을 직접 수정할 수 있을 것이다. 물질 발굴이 중요한 부품·소재 기업에도 호재로 작용할 수 있다. 가령 초거대 AI가 물질 합성을 로봇에게 명령하고 합성 결과를 바탕으로 분자 구조를 최적화함으로써 다음 물질 합성을 명령하는 신물질 실험 자율주행 기술이 완성될 것이다. 신약 물질, 자동차 전지 재료, 디스플레이 발광 소재 개발 등 분야에 큰 변화가 예상된다. 초거대 AI의 보유 수준이 기업의 생존을 결정할 것으로 추정되는 이유다.창조의 영역에 발을 들인 초거대 AI는 스스로 진화함으로써 그 가치를 극대화할 것이다. 단순 스케치만으로도 고품질의 상품 렌더링 및 사용자경험(UX)을 생성할 뿐만 아니라 가상 공장에서 제품을 설계·생산해봄으로써 발견한 문제점을 다시 설계에 반영해 최적화할 것이다. 상품 출시 후에는 구매 고객의 반응을 분석해 고객이 원하는 방향으로 직접 개선하는 것까지 가능케 할 것이다. 가령 출시된 상품의 소프트웨어(SW) 오류를 스스로 감지, 직접 프로그램 코드를 수정해 업데이트할 수 있다.

이렇게 상품 개발 전반을 경험한 초거대 AI는 최적 신상품 개발 방법을 스스로 찾아 진화할 것이다. 또 초거대 AI로 인해 인간을 모사하는 수준의 디지털 휴먼이 아니라 스스로 능력이 진화하는 진정한 메타 휴먼이 등장할 것이다. 이 세상에 존재하는 모든 언어로 자연스럽게 대화할 수 있을 뿐만 아니라 음악을 작곡하고, 노래를 부르는 능력이 지속 발전하는 가상 연예인의 등장은 기업의 마케팅 활동을 원점에서 재검토하게 할지도 모른다.

아직 GPT-3는 학습 결과를 설명하는 데 미흡하고 일부 편향된 결과를 보이기도 하지만 지속적인 연구를 통해 극복될 것으로 예상된다. 향후 스스로 의사 결정하고 진화할 수 있는 잠재력을 지닌 초거대 AI를 보유한 기업은 내부 생산성을 극대화함으로써 시장에서 경쟁 우위를 점할 것이다. 또 미세 고객군별 숨은 니즈를 찾아 새로운 차원의 고객 만족을 달성해 충성 팬을 양산할 수 있다. 궁극적으로는 우리 모두에게 더 편리하고 더 즐거우며 더 건강하고 행복한 삶을 선물할 것이다. 어쩌면 우리 후손 세대는 인류의 가장 위대한 발명품으로 초거대 AI를 1위로 평가할 수도 있지 않을까 예상해본다.

핫이슈