Viterbi Morpheme Restoration in Korean

한국어에서 Viterbi 형태소 복원

  • Lee, Je-seung (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University) ;
  • Kim, Jae-hoon (Dept. of Computer Engineering and Interdisciplinary Major of Maritime AI Convergence, Korea Maritime & Ocean University)
  • 이제승 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공) ;
  • 김재훈 (한국해양대학교, 컴퓨터공학과 및 해양인공지능융합전공)
  • Published : 2021.10.14

Abstract

본 논문은 한국어에서 형태소 복원을 위한 새로운 방법을 제안한다. 일반적으로 기계학습 기반 형태소 분석에서 형태소 복원은 기분석 사전과 약간의 경험규칙을 이용한다. 이와 같은 방법은 모호성을 해결하기 위해 사전에 모든 정보를 저장하는 것이 불가능할 뿐 아니라 단음절 이형태의 모호성을 해결할 수 없을 것이다. 이러한 문제를 완화하기 위해 본 논문에서는 생성된 모호성을 Viterbi 알고리즘을 이용해서 해소한다. 본 논문의 형태소 복원 과정은 기본적으로 기분석 사전과 약간의 경험규칙을 이용하여 형태소 복원 후보를 찾고 여러 후보가 있을 경우(모호성의 생성), 그 결과를 Viterbi 알고리즘으로 이형태를 결정한다. 실험을 위해 모두의 말뭉치(형태 분석)를 사용하고, 평가는 NER 방식으로 평가한다. 그 결과 품사 부착에 대해 96.28%정도의 성능을 보여주었다.

Keywords