유포자의 표현 습관까지 반영해 탐지한 연구 성과 발표
"'합성곱 신경망'으로 가짜뉴스 효율적 탐지 가능"
'합성곱 신경망'을 활용해 뉴스 문맥부터 유포자의 감성 변화 패턴까지 추출해 가짜뉴스 여부를 탐지한 연구 결과가 나와 주목받고 있다.

28일 손진곤 한국방송통신대 컴퓨터과학과 교수 등이 정보처리학회논문지에 낸 'CNN 기반 감성 변화 패턴을 이용한 가짜뉴스 탐지'에 따르면 합성곱 신경망(Convolutional Neural Network·CNN) 활용 시 기존보다 가짜뉴스 탐지 정확도를 높일 수 있다.

합성곱 신경망이란 필터링 기법을 인공신경망에 적용해 이미지를 효과적으로 처리할 수 있는 심층 신경망 기법이다.

기존 딥러닝 연구는 기사의 어휘, 제목과 부제, 리드, 본문 등을 주요 분석 대상으로 해 가짜뉴스에서 공통적인 특성을 추출했고 부가적으로 언론사, 기자, 날짜, 확산 경로, 네트워크 트래픽 등의 메타 데이터를 참고해왔다.

그러나 이 데이터들은 내용 일부를 쉽게 수정할 수 있어 다량의 데이터를 분석한 모델이라 해도 높은 탐지 정확도를 장기간 유지하기는 어려웠다.

연구진은 합성곱 신경망을 이용하면 가짜뉴스의 문맥적 특성을 분석하고 장단기 메모리(장기적 의존 관계 학습을 위한 딥 러닝 모델)를 활용해 감성 변화 패턴을 추출할 수 있다고 설명했다.

감성 변화 패턴은 등장 순서에 의존적인 문장 성분별 감성 점수를 계산하며 가짜뉴스 유포자의 성격, 환경, 교육 및 가짜뉴스를 작성할 때 보이는 표현 습관까지 반영한다.

연구진은 두 가지 가짜뉴스 탐지 모델을 설계했다.

연구진은 '미국, 영국 질병청에 보고된 백신 부작용 중증 사망자가 코로나 사망자 수를 훌쩍 넘기고 있다.

현 상황에서 백신은 답이 아닌 것으로…(파악된다)'라는 가짜뉴스 문장을 만들었다.

이어 '경찰이 무력으로 백신 강제 접종할 수 있다.

문을 부수는 영상과 함께 한국에서도 경찰력을 동원한 백신 강제 접종이 이뤄질 것이라고…(전망된다)'라는 가짜뉴스 모델도 제시했다.

연구진은 이 두 가지 가짜뉴스를 문장 단위로 쪼개고, 쪼갠 단어와 문장을 대상으로 감성 분석을 적용해 감성 점수를 할당한 후 장단기 메모리를 사용했다.

마지막으로 문맥 정보와 감성 변화 패턴을 결합해 뉴스의 사실 여부를 식별했다.

그 결과 서울대 언론정보연구소의 'SNU팩트체크' 데이터 세트를 이용한 비교 실험에서 감성 변화 패턴을 추가로 활용한 제안 모델이 콘텐츠 기반의 전통적 가짜뉴스 탐지 모델과 비교했을 때 성능 면에서 유의미한 개선이 있는 것으로 나타났다.

제안 모델은 감성 변화 패턴을 적용하기 전과 비교해 재현율이 29.2% 향상된 것으로 확인됐으며, 이는 가짜뉴스 탐지 모델의 임곗값을 낮추는 방향으로 영향을 주고 있음을 의미한다고 연구진은 설명했다.

사실이 확인된 뉴스를 가짜뉴스라고 잘못 예측했을 때보다 가짜뉴스를 진짜라고 판단하는 경우의 위험이 상대적으로 큰 현실을 고려했을 때, 감성 변화 패턴을 적용한 제안 모델은 가짜뉴스 근절이라는 목적에 한층 더 부합한다고 볼 수 있다는 것이다.

연구진은 "감성 변화 패턴은 뉴스 분석에 감성분석을 활용하는 기존 접근법과 차별화되는 부분으로서 뉴스를 긍정 또는 부정으로 단순하게 분류하지 않고, 감성이 문장 단위에 따라 어떻게 변화하는지를 분석한다"고 설명했다.

/연합뉴스