품사태깅을 위한 어휘규칙의 자동획득

Automatic Acquisition of Lexical Rules for Part-of-Speech Tagging

  • Lee, Sang-Zoo (Department of Computer Science and Engineering Korea University) ;
  • Ryu, Won-Ho (Department of Computer Science and Engineering Korea University) ;
  • Kim, Jin-Dong (Department of Computer Science and Engineering Korea University) ;
  • Rim, Hae-Chang (Department of Computer Science and Engineering Korea University)
  • 발행 : 1998.10.09

초록

기존의 어휘규칙기반 품사태거는 품사문맥이나 어휘확률만을 사용하는 통계적 품사태거에 의해 해결되지 않는 형태론적 중의성을 어휘문맥을 참조하는 어휘규칙을 사용함으로써 효과적으로 해결할 수 있었다. 그러나 어휘규칙을 수작업으로 획득하기 때문에 규칙 획득에 많은 시간이 소요되어 소량의 규칙만이 사용되었다. 본 논문에서는 품사부착말뭉치로부터 어휘규칙을 자동으로 획득하는 방법을 제안한다. 제안된 방법으로 자동획득된 어휘규칙을 사용하여 실험말뭉치의 66.1%를 98.8%의 정확률로 태깅하였다. 이로써 통계적 품사태거만을 사용할 때(95.43% 정확률) 보다 어휘규칙과 결합할 때(96.12% 정확률) 통계적 품사태거의 성능이 약 15.1%(0.69% 정확률)만큼 향상되었다. 또한 제안된 방법은 영어 품사태깅에 대해서도 효과적임이 실험을 통해 증명되었다.

키워드