Korean Depenency Parsing using a Maximum Spanning Tree

최대신장트리를 이용한 한국어 의존구문분석

  • Park, Young-Min (Department of Computer Science and Engineering, Sogang University) ;
  • Seo, ung-Yun (Department of Computer Science and Engineering, and Interdisciplinary Program of Integrated Biotechnology, Sogang University)
  • 박영민 (서강대학교 컴퓨터공학과) ;
  • 서정연 (서강대학교 컴퓨터공학과/바이오융합기술협동과정)
  • Published : 2010.10.08

Abstract

본 논문에서는 그래프 기반의 최대신장트리(Maximum Spanning Tree)를 이용한 한국어 의존구문분석 방법을 제안한다. 우리는 최대신장트리 알고리즘을 한국어의 특성인 지배성분 후위의 원칙과 투사성의 원칙을 적용하여 한국어 의존구문분석에 적합한 알고리즘을 만들었다. 제안한 알고리즘은 기존의 한국어 의존구문분석의 방법들보다 낮은 시간복잡도를 가지며 대용량 말뭉치를 학습하기 위해 증분학습이 가능하고 비교적 학습속도가 빠른 Averaged Perceptron 알고리즘을 사용하였다. 실험결과 제안한 방법은 비교적 열악한 환경인 복문이 포함된 장문의 문장에서도 뛰어난 성능을 보여주었다,

Keywords