Lattice-based discriminative approach for Korean morphological analysis and POS tagging

래티스상의 구조적 분류에 기반한 한국어 형태소 분석 및 품사 태깅

  • Na, Seung-Hoon (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute) ;
  • Kim, Chang-Hyun (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute) ;
  • Kim, Young-Kil (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute)
  • Published : 2013.10.06

Abstract

본 논문에서는 래티스상의 구조적 분류에 기반한 한국어 형태소 분석 및 품사 태깅을 수행하는 방법을 제안한다. 제안하는 방법은 입력문이 주어질 때 어휘 사전을 참조하여, 형태소를 노드로 취하고 인접형태 소간의 에지를 갖도록 래티스를 구성하며, 구성된 래티스상 가장 점수가 높은 경로상에 있는 형태소들을 분석 결과로 제시하는 방법이다. 실험 결과, ETRI 품사 부착 코퍼스에서 기존의 1차 linear-chain CRF에 기반한 방법보다 높은 어절 정확률 그리고 문장 정확률을 얻었다.

Keywords