기계학습과 언어처리에 기반한 문자메시지 분류

Text Message Classification based on Machine Learning

  • 선주오 (금오공과대학교, 컴퓨터소프트웨어공학과) ;
  • 지명근 (금오공과대학교, 컴퓨터소프트웨어공학과) ;
  • 최범휘 (금오공과대학교, 컴퓨터소프트웨어공학과) ;
  • 이현아 (금오공과대학교, 컴퓨터소프트웨어공학과)
  • Sun, Juoh (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Ji, Myeonggeun (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Choi, Beomhwi (Kumoh National Institute of Technology, Department of Computer Software Engineering) ;
  • Lee, Hyunah (Kumoh National Institute of Technology, Department of Computer Software Engineering)
  • 발행 : 2019.10.10

초록

휴대전화 메시지로는 결제, 인증번호, 택배, 광고 등의 다양한 문자들이 수신된다. 이 문자들은 서로 섞여 있어 이용자가 찾고자 하는 문자를 찾는 데 어려움이 있다. 본 논문에서는 기계학습과 단어 임베딩을 통해 메시지들을 카테고리로 분류하는 방법을 제안하고, 이를 구현한 안드로이드 앱을 소개한다. 앱에서는 택배, 카드, 인증, 공공기관, 통신사, 대화, 기타의 7개의 분류로 메시지를 분류하며, 자동 분류에서는 수동 태깅한 5802건의 문자메시지를 사용한다. 앱에서는 저장된 문자메시지간 유사도에 기반한 오프라인에 서의 자동 분류를 지원하여 개인정보 노출에 대한 거부감이 있는 사용자의 요구를 반영한다.

키워드