AI에 '윤봉길 의사' 그려달라 했더니…"北 군인?" 황당 결과
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
생성형 AI 무한 가능성 확인했지만…언어·문화적 한계도
오픈AI의 챗봇 서비스 '챗(Chat)GPT'가 화제가 되면서 이미지 생성 인공지능(AI)에 대한 관심도 뜨거워지고 있다. 이미 수 년전부터 텍스트를 이미지로 변환하는 프로그램들이 나왔지만 최근 챗GPT 열풍으로 이용자들이 크게 늘어나는 추세다.
2일 업계에 따르면 오픈AI가 지난해 11월 출시한 챗GPT는 지난달 기준 가입자 수가 3억명을 돌파했다. 번역, 창작, 콘텐츠 생성 등 다양한 분야에서 직관적 서비스를 제공해 선풍적 인기를 끌고 있다. 그러면서 오픈AI가 2021년 1월 내놓은 이미지 생성 AI 달리2(DALL·E2) 역시 다시 주목받고 있다. 이후 스테이블 디퓨전, 미드저니, 딥 드림 제너레이터, 노벨AI 등 이미지 생성 AI가 속속 출시됐다. 여기에 최근 자연스러운 음성AI 기술까지 등장해 각종 서비스와 결합을 시도하고 있어 산업 패러다임이 빠르게 변화하고 있다. 실제 이미지 생성 AI를 사용해보면 상당한 수준의 결과물을 내놓는다. 스테이블 디퓨전에 1910년대 영국 사람과 거리의 모습을 보여달라고 하자 약 1분 뒤 나타난 이미지는 제법 훌륭했다. AI가 만든 이미지라고 하지 않으면 모를 정도로 거리에 보이는 도로와 마차, 주택건물, 인물 등이 실재하는 것처럼 표현됐다.
뛰어난 그래픽을 만들어주는 미드저니에 동일한 검색어를 입력하자 나타난 결과물 역시 감탄을 자아냈다. 마치 영화 CG 전문가 직접 작업한 창작물처럼 정교하고 세밀하게 표현된 영국 거리 이미지가 도출됐다. "프랑스의 영웅 잔 다르크가 깃발을 들고 백년전쟁에서 활약하는 모습을 그려줘"라고 하자 고화질 게임 캐릭터와 비슷한 여전사의 모습이 나타났다.
이처럼 생성 AI가 국내 콘텐츠 착장에 취약한 이유는 서구 기반 데이터를 압도적으로 많이 학습했기 때문으로 보인다. 대다수 생성 AI 프로그램은 수많은 기존 데이터를 학습하고 재구성하는 방식으로 결과물을 추출한다. 갖고 있는 정보가 많을수록 더 세밀한 표현이 가능한 구조다.
이미지 생성 AI는 이미지와 동영상, 디자인 및 설계, 문화 예술 등 다양한 분야에서 풍부한 작업물을 만들어낼 수 있어 시장 전망이 밝다. 시장조사업체 그랜드뷰리서치에 따르면 전 세계 생성 AI 시장 규모는 2022년 101억달러(약 12조4219억원)을 기록했다. 연평균 34.6%의 성장률로 2030년에는 1093억달러(약 134조4280억원)까지 불어날 것으로 전망된다.
미래 먹거리로 각광받는 생성 AI 시장을 선점하기 위해 국내 정보기술(IT) 기업들도 서비스 개발과 고도화에 나서고 있다. 네이버는 한국어 검색에서 챗GPT보다 6500배 탁월한 성능의 '하이퍼클로바X'를 오는 7월 출시할 계획이다. 카카오는 AI 연구전문 자회사 카카오브레인을 통해 AI '칼로'를 공개했고 올 하반기에는 AI 챗봇 '코(Ko)GPT'를 내놓는다. SK텔레콤 역시 올해 AI 서비스 '에이닷'를 공식 출시했으며 KT는 지난해 선보인 초거대 AI '믿음(MIDEUM)' 상용화에 박차를 가하고 있다.
조아라 한경닷컴 기자 rrang123@hankyung.com
헛똑똑이 AI?…소름 돋는 그림 알고보니
2일 업계에 따르면 오픈AI가 지난해 11월 출시한 챗GPT는 지난달 기준 가입자 수가 3억명을 돌파했다. 번역, 창작, 콘텐츠 생성 등 다양한 분야에서 직관적 서비스를 제공해 선풍적 인기를 끌고 있다. 그러면서 오픈AI가 2021년 1월 내놓은 이미지 생성 AI 달리2(DALL·E2) 역시 다시 주목받고 있다. 이후 스테이블 디퓨전, 미드저니, 딥 드림 제너레이터, 노벨AI 등 이미지 생성 AI가 속속 출시됐다. 여기에 최근 자연스러운 음성AI 기술까지 등장해 각종 서비스와 결합을 시도하고 있어 산업 패러다임이 빠르게 변화하고 있다. 실제 이미지 생성 AI를 사용해보면 상당한 수준의 결과물을 내놓는다. 스테이블 디퓨전에 1910년대 영국 사람과 거리의 모습을 보여달라고 하자 약 1분 뒤 나타난 이미지는 제법 훌륭했다. AI가 만든 이미지라고 하지 않으면 모를 정도로 거리에 보이는 도로와 마차, 주택건물, 인물 등이 실재하는 것처럼 표현됐다.
뛰어난 그래픽을 만들어주는 미드저니에 동일한 검색어를 입력하자 나타난 결과물 역시 감탄을 자아냈다. 마치 영화 CG 전문가 직접 작업한 창작물처럼 정교하고 세밀하게 표현된 영국 거리 이미지가 도출됐다. "프랑스의 영웅 잔 다르크가 깃발을 들고 백년전쟁에서 활약하는 모습을 그려줘"라고 하자 고화질 게임 캐릭터와 비슷한 여전사의 모습이 나타났다.
AI 무한 가능성 확인했지만…언어·문화적 한계
반면 같은 프로그램으로 1910년대 한국의 모습과 유명인물 등을 보여달라고 했을 때는 결과물이 만족스럽지 않았다. 스테이블 디퓨전의 경우 인물이 정교하게 표현되지 않거나 중국이나 일본 것으로 보이는 건축물과 의복 등이 나타나기도 했다. 미드저니에 "윤봉길 의사가 훙커우공원 일본군 행사에서 도시락 폭탄을 던지는 모습을 그려줘"라고 하자 나온 결과물은 황당한 수준이었다. 실제 윤봉길 의사와 달리 체중이 많이 나가는 모습의 남성으로 묘사되거나, 착용한 모자와 상의가 북한 군인을 연상시키는 작업복 같이 보이기도 했다. 10차례 이상 재생성해 그나마 근접한 이미지(가장 오른쪽)가 나왔다.이처럼 생성 AI가 국내 콘텐츠 착장에 취약한 이유는 서구 기반 데이터를 압도적으로 많이 학습했기 때문으로 보인다. 대다수 생성 AI 프로그램은 수많은 기존 데이터를 학습하고 재구성하는 방식으로 결과물을 추출한다. 갖고 있는 정보가 많을수록 더 세밀한 표현이 가능한 구조다.
이미지 생성 AI는 이미지와 동영상, 디자인 및 설계, 문화 예술 등 다양한 분야에서 풍부한 작업물을 만들어낼 수 있어 시장 전망이 밝다. 시장조사업체 그랜드뷰리서치에 따르면 전 세계 생성 AI 시장 규모는 2022년 101억달러(약 12조4219억원)을 기록했다. 연평균 34.6%의 성장률로 2030년에는 1093억달러(약 134조4280억원)까지 불어날 것으로 전망된다.
미래 먹거리로 각광받는 생성 AI 시장을 선점하기 위해 국내 정보기술(IT) 기업들도 서비스 개발과 고도화에 나서고 있다. 네이버는 한국어 검색에서 챗GPT보다 6500배 탁월한 성능의 '하이퍼클로바X'를 오는 7월 출시할 계획이다. 카카오는 AI 연구전문 자회사 카카오브레인을 통해 AI '칼로'를 공개했고 올 하반기에는 AI 챗봇 '코(Ko)GPT'를 내놓는다. SK텔레콤 역시 올해 AI 서비스 '에이닷'를 공식 출시했으며 KT는 지난해 선보인 초거대 AI '믿음(MIDEUM)' 상용화에 박차를 가하고 있다.
조아라 한경닷컴 기자 rrang123@hankyung.com