비음수 행렬 분해와 동적 분류체계를 사용한 이메일 분류

Email Classification using Dynamic Category Hierarchy and Non-negative Matrix Factorization

  • 박선 (전북대학교 전라북도 전략산업 혁신을 위한 전자정보고급인력양성사업단) ;
  • 안동언 (전자정보공학부, 전북대학교)
  • Park, Sun (Advanced Graduate Education Center of Jeonbuk for Electronics and Information Technology-BK21, Chonbuk National University) ;
  • An, Dong Un (Division of Electronic & Information Engineering, Chonbuk National University)
  • 발행 : 2009.10.09

초록

이메일의 사용증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factrazation)를 기반으로 한 자동 분류 주제 생성 방법과 동적 분류 체계(DCH, Dynamic Category Hierachy) 방법을 결합한 새로운 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 분류 결과 사용자의 요구사항을 만족하지 못하면 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

키워드