한국어 품사 및 동형이의어 태깅을 위한 마르코프 모델과 은닉 마르코프 모델의 비교

Comparison between Markov Model and Hidden Markov Model for Korean Part-of-Speech and Homograph Tagging

  • 신준철 (울산대학교 컴퓨터정보통신공학) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학)
  • Shin, Joon-Choul (Dept. of Computer Engineering & Information Technology, Ulsan University) ;
  • Ock, Cheol-Young (Dept. of Computer Engineering & Information Technology, Ulsan University)
  • 발행 : 2013.10.06

초록

한국어 어절은 많은 동형이의어를 가지고 있기 때문에 주변 어절(또는 문맥)을 보지 않으면 중의성을 해결하기 어렵다. 이런 중의성을 해결하기 위해서 주변 어절 정보를 입력받아 통계적으로 의미를 선택하는 기계학습 알고리즘들이 많이 연구되었으며, 그 중에서 특히 은닉 마르코프 모델을 활용한 연구가 높은 성과를 거두었다. 일반적으로 마르코프 모델만을 기반으로 알고리즘을 구성할 경우 은닉 마르코프 모델 보다는 단순하기 때문에 빠르게 작동하지만 정확률이 낮다. 본 논문은 마르코프 모델을 기반으로 하면서, 부분적으로 은닉 마르코프 모델을 혼합한 알고리즘을 제안한다. 실험 결과 속도는 마르코프 모델과 유사하며, 정확률은 은닉 마르코프 모델에 근접한 것으로 나타났다.

키워드