Analyzing Korean hate-speech detection using KcBERT

KcBERT를 활용한 한국어 악플 탐지 분석 및 개선방안 연구

  • 정세영 (연세대학교 스마트 시스템 연구실) ;
  • 김병진 (연세대학교 스마트 시스템 연구실) ;
  • 김대식 (연세대학교 스마트 시스템 연구실) ;
  • 김우영 (연세대학교 스마트 시스템 연구실) ;
  • 김태용 (연세대학교 스마트 시스템 연구실) ;
  • 윤현수 (연세대학교 산업공학과) ;
  • 김우주 (연세대학교 스마트 시스템 연구실)
  • Published : 2023.10.12

Abstract

악성댓글은 인터넷상에서 정서적, 심리적 피해를 주는 문제로 인식되어 왔다. 본 연구는 한국어 악성댓글 탐지 분석을 위해 KcBERT 및 다양한 모델을 활용하여 성능을 비교하였다. 또한, 공개된 한국어 악성댓글 데이터가 부족한 것을 해소하기 위해 기계 번역을 이용하고, 다국어 언어 모델(Multilingual Model) mBERT를 활용하였다. 다양한 실험을 통해 KcBERT를 미세 조정한 모델의 정확도 및 F1-score가 타 모델에 비해 의미 있는 결과임을 확인할 수 있었다.

Keywords

Acknowledgement

이 논문은 국토교통부의 스마트시티 혁신인재육성사업으로 지원되었습니다. 본 연구는 연세대학교 딥러닝이론및응용(IIE7721)의 연장으로 진행되었으며, 윤현수 교수님께 감사드립니다.