본문 바로가기

    ADVERTISEMENT

    스마일게이트 AI센터, 악플·혐오 발언 데이터셋 구축

    • 공유
    • 댓글
    • 클린뷰
    • 프린트
    스마일게이트 AI센터, 악플·혐오 발언 데이터셋 구축
    스마일게이트 AI센터는 악플 및 혐오 발언 데이터셋을 구축했다고 20일 밝혔다.

    스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.

    이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

    데이터는 2019년 1월 1일부터 2021년 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글에서 수집됐다.

    센터는 혐오 관련 데이터의 시의성과 편향성 등을 감안해 55만여 개 데이터를 기반으로 1만 개 데이터셋을 구축했다.

    '여성·가족' '성소수자' '남성' '인종·국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다.

    혐오 발언 분류를 위한 기준 모델도 제시했다.

    이번에 수집된 데이터는 스마일게이트 AI센터 깃허브 페이지를 통해 이달 중 공개된다.

    악플 및 혐오 발언 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 회사 측이 기대했다.

    스마일게이트는 향후 지속적인 연구·개발을 실시해 확보된 기술력을 바탕으로 혐오 표현을 더 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화할 계획이다.

    /연합뉴스

    ADVERTISEMENT

    1. 1

      빌보드 1위 휩쓸었는데…"박효신은 못 따라해" 알고 보니 [이슈+]

      "작곡가 되기? 이제 어렵지 않습니다. 음악 만들어 주는 AI에서 원하는 장르를 선택하고, 샘플 개수와 악기, 모드를 고르면 곡이 뚝딱 나옵니다."몇 번의 클릭이면 노래 한 곡이 완성되는 시대다. 장르를 고르고, 분...

    2. 2

      "내 청춘이 돌아왔다" 아재들 '열광'…26년차 '악마의 게임' 역주행 [이슈+]

      높은 중독성으로 유저들 사이에서 '악마의 게임'이란 별칭으로 불리는 액션 롤플레잉게임(RPG)의 고전 '디아블로 2: 레저렉션'이 화제다. 신규 직업 추가 카드를 꺼내들면서 2000년 원...

    3. 3

      T1 잡은 ‘여우’ BNK, ‘LCK의 호랑이’ 젠지도 꺾을까 [이주현의 로그인 e스포츠]

      여우와 호랑이 중 LCK컵 결승전에 먼저 선착할 팀은 누구일까?국내 리그오브레전드(LoL) e스포츠 프로 리그인 LCK(리그오브레전드 챔피언스 코리아)의 2026 시즌 첫 대회인 LCK컵이 본격적인 우승 경쟁에 돌입...

    ADVERTISEMENT

    ADVERTISEMENT