세계적으로 큰 인기를 끌며 교육 현장에서 부정행위 악용 우려를 낳고 있는 오픈AI의 '챗GPT'(ChatGPT) 같은 언어모델도 '복붙'(복사해 붙여넣기) 등 다양한 방법으로 표절을 한다는 연구 결과가 나왔다.
미국 펜실베이니아주립대(PSU) 이동원 교수팀은 16일(현지시간) 오픈AI의 'GPT-2'가 생성한 텍스트를 훈련에 사용된 자료와 비교 분석한 결과 복사해 붙여넣기(vervatim)와 출처 인용 없이 문장 바꾸기(paraphrase), 아이디어 도용(idea plagiarism) 같은 다양한 표절을 하는 것으로 나타났다고 밝혔다.
연구팀은 이 같은 내용의 연구 논문을 이날 공개했으며, 이를 오는 4월 30일~5월 4일 오스틴 텍사스대에서 열리는 '2023 미국컴퓨터학회(ACM) 웹 콘퍼런스'에서 발표할 예정이다.
이 교수는 "표절은 다양한 형태로 나타난다"며 "언어모델이 복사해 붙여넣기뿐 아니라 스스로 인식하지 못한 채 더 정교한 형태의 표절도 하는지 밝혀내고자 했다"고 말했다.
연구팀은 이 연구에서 복사해 붙이기와 출처 인용 없이 문장 바꾸기, 출처 명시 없는 아이디어 도용하기 같은 표절을 자동 감지하는 프로그램을 개발, GPT-2가 생성한 21만 건의 텍스트를 언어모델 훈련에 사용된 800만 건의 문서와 비교했다.
또 사전 훈련된 일반 언어모델과 특정 분야에 초점을 맞춰 미세조정한 언어모델이 생성한 텍스트의 표절에 어떤 차이가 있는지도 분석했다.
그 결과 언어모델이 생성한 텍스트에는 복사해 붙이기는 물론 출처 인용 없이 문장 바꾸기, 출처를 명시하지 않고 아이디어 도용하기 등 3가지 표절이 모두 포함된 것으로 나타났다.
또 훈련에 사용된 데이터세트와 매개변수가 클수록 표절도 더 많은 것으로 밝혀졌다.
특정 분야에 맞춰 미세조정된 언어모델은 복사해 붙이기 표절은 줄어들었으나 출처 명시 없는 문장 바꾸기와 아이디어 표절은 늘어난 것으로 나타났다.
또 언어모델은 세 가지 표절을 하면서 개인정보를 그대로 드러내는 문제점도 노출했다.
연구팀은 이 연구 결과는 생성형 언어모델과 언어모델이 제기하는 윤리적, 철학적 문제에 대한 더 많은 연구가 필요하다는 것을 보여준다고 지적했다.
공동연구자인 미시시피대 타이 러 교수는 "생성물이 매력적일 수 있고 언어모델이 사용하기에 재미있을 수 있고 특정 작업에 생산적으로 보일 수도 있지만 이게 실용적이라는 뜻은 아니다"라며 "생성형 언어모델의 윤리적 문제와 저작권 문제에 주의를 기울여야 한다"고 말했다.
연구팀은 또 이 연구 결과는 GPT-2에만 적용되지만 이번에 개발한 표절 자동 감지 프로그램은 챗GPT 등 최신 언어모델의 표절 여부를 검사하는 데에도 활용될 수 있을 것이라고 밝혔다.
이 교수는 "언어모델을 교육할 때 표절하지 않는 방법은 가르치지 않고 인간 글쓰기를 흉내 내도록 훈련했기 때문에 표절이 예상 못 한 결과는 아니다"라며 "이제 언어모델에 더 적절한 글쓰기를 가르칠 때이고 갈 길이 멀다"고 말했다.
도널드 트럼프 미국 대통령이 '한국이 미국에 비해 4배 높은 관세를 부과하고 있다'며 상호관세 부과를 시사한 것과 관련해 정부는 "사실과 다르다"고 반박했다. 실제로는 한미 간 자유무역협정(FTA) 체결로 인해 0%대 관세가 부과되고 있다는 설명이다. 뉴스1 보도에 따르면 5일 정부 관계자는 "(트럼프 대통령의) 관세율 발언이 정확하지 않다는 것을 미국 정부에 공식적으로 설명할 예정"이라고 밝혔다. 주미대사관을 통해 미국 정부에 한국의 대미 관세율이 높지 않다는 사실관계를 설명할 것이라는 게 정부 측의 이야기다.트럼프 대통령은 4일(현지시간) 집권 2기 첫 상하원 합동의회 연설에서 "한국이 (미국에 비해) 4배 높은 관세를 부과하고 있다"면서 "우리는 한국에 군사적으로, 그리고 여러 가지 다른 방법으로 도움을 주고 있다. 이 시스템은 미국에 결코 공평하지 않다"고 언급했다.이날부터 25% 관세를 부과한 멕시코·캐나다, 20% 추가 관세를 부과한 중국 등에 이어 한국도 트럼프 관세의 주요 타깃이라는 점이 드러난 셈이다.'상호 관세'는 다른 나라가 미국 제품에 매기는 관세율과 똑같은 세율을 그 나라의 제품에 부과하는 것을 의미한다. 예를 들어 A 국가가 미국산 제품에 10%의 관세를 부과하면, 미국도 A 국가의 제품에 10%의 관세를 매기겠다는 것이다.정부는 트럼프 대통령의 발언이 사실이 아니라고 반박했다. 우리나라의 평균 최혜국 대우(MFN) 관세율은 13.4%, 미국의 MFN 관세율은 3.3%로 4배 수준이 맞지만, FTA 체결로 인해 실제로는 이보다 훨씬 낮은 관세를 부과하고 있기 때문이다.정부에 따르면 지난 2012년 3월부터 발효된 한미 FTA에 따라
중국이 유엔에 내는 분담금 비율이 올해 처음으로 20%를 넘었다. 5일 니혼게이자이신문 등 외신에 따르면 중국은 2019년 일본을 제치고 유엔 분담금 액수가 두 번째로 많은 나라가 됐고, 올해에는 분담금 비율이 20%를 넘어서며 미국과 비슷한 수준에 육박했다.중국은 세계보건기구(WHO) 분담금 비율도 2위를 차지하고 있다. 중국인인 취둥위 유엔 식량농업기구(FAO) 사무총장도 2023년 재선에 성공하며 국제사회에서 영향력을 확대하고 있다.트럼프 대통령이 주유엔 대사로 임명한 엘리스 스테파닉 하원 의원은 이와 관련해 “중국이 공산당 간부와 외교관을 유엔의 여러 기구에 배치하고 있다”라며 중국이 과도한 영향력 확대를 경계해야 한다고 강조했다.반면 지난 1월 재집권한 트럼프 대통령은 파리 기후협정, WHO 등에서 탈퇴하겠다고 밝히는 등 중국과 반대되는 태도를 보이고 있다.안토니우 구테흐스 유엔 사무총장은 지난달 28일(현지시간) 미국의 대외원조 축소에 우려를 표하며 “미국의 인도주의적 역할과 영향력 감소는 미국의 이익에 반하는 결과를 가져올 것”이라고 경고했다.유엔의 지속적인 자금난 속에서 중국의 분담금 확대는 단비같이 느껴질 수 있다는 견해도 나온다고 닛케이는 보도했다.이 신문은 “유엔에서 중국의 존재감이 커지고 있다”며 “중국은 (국제사회에서) 포위망을 구축하고 있지만 미국은 스스로 고립을 심화하고 있다”고 설명했다.이어 트럼프 정권 기간에 유엔 내 ‘미국 부재’가 이어진다면 중국이 그 공백을 파고들 가능성이 높다고 지적했다.박수림 한경닷컴 기자 paksr365@hankyung.com
도널드 트럼프 미국 대통령이 미국에 반도체 공장 등을 지으면 보조금을 주는 반도체법(Chips Act)을 폐지해야 한다고 4일(현지시간) 밝혔다. 반도체법은 전임 바이든 행정부 당시 제정돼, 미국에 투자한 삼성과 SK하이닉스 등 우리 기업들도 보조금을 받을 예정이다.트럼프 대통령은 이날 워싱턴DC의 미 연방 의회에서 행한 상하원 합동회의 연설에서 "반도체법과 남은 것은 모두 없애야 한다"고 말했다. 이어 마이크 존슨 하원의장을 향해 "그 돈으로 부채를 줄이거나 다른 어떤 이유든 원하는 대로 사용해야 한다"고 했다.이 언급은 자신의 집권 2기 행정부 출범 이후 소프트뱅크, 오라클, 애플, TSMC 등 빅테크 및 반도체 기업들이 대규모 대미 투자를 약속했다고 거론하면서 나왔다.트럼프 대통령은 그동안 미국에 투자하는 기업에 보조금을 지급해 투자를 유도하는 반도체법과 관련, 높은 관세를 부과하면 기업에 보조금을 주지 않고도 투자를 유치할 수 있다며 반도체법에 비판적인 입장을 보여왔다.트럼프 대통령은 반도체법을 "끔찍한 것"이라고 거듭 비판한 뒤 "우리는 수천억 달러를 (보조금으로) 주지만 아무 의미도 없다"며 "그들은 우리의 돈을 가져가서 쓰지 않고 있다"고 지적했다.또 "그들(반도체 기업들)에게 중요한 것은 우리가 돈을 주는 게 아니라 (그들이)관세를 내지 않도록 하는 것뿐"이라며 "우리는 그들에게 돈을 줄 필요가 없다. 그리고 그들은 미국에 (공장을) 건설하면 관세를 내지 않아도 되기 때문에 (투자하러) 올 것"이라고 강조했다.반도체법은 2022년 미 의회에서 초당적으로 통과된 법안으로 미국에 반도체 생산시설을 건립하