Application portable Part-Of-Speech tagger mapping

응용을 위한 품사 태깅 시스템의 매핑

  • Kim, Jun-Seok (Natural Language Processing Lab. Dept. of Computer Science & Engineering, POSTECH) ;
  • Cha, Jung-Won (Natural Language Processing Lab. Dept. of Computer Science & Engineering, POSTECH) ;
  • Lee, Geun-Bae (Natural Language Processing Lab. Dept. of Computer Science & Engineering, POSTECH)
  • 김준석 (포항공과대학교 컴퓨터공학과 자연어 처리 연구실) ;
  • 차정원 (포항공과대학교 컴퓨터공학과 자연어 처리 연구실) ;
  • 이근배 (포항공과대학교 컴퓨터공학과 자연어 처리 연구실)
  • Published : 2000.10.13

Abstract

품사 태깅 시스템은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 분야인 구문분석, 의미분석의 전처리로 사용되거나, 기계번역, 정보검색이나 음성인식 및 합성 등과 같은 많은 응용 시스템을 위해서도 필요하다. 이렇게 여러 가지 목적을 위해 품사 태깅 시스템은 존재하는데, 각각의 응용을 위해서 최적화된 태깅 시스템을 따로 구성하기도 하고, 하나의 태깅 시스템을 여러 가지 응용을 위해서 사용하기도 한다. 이때, 문제가 되는 것 중에 하나는 각 응용마다 요구하는 품사 태그 세트가 다르다는 것이다. 품사 태그세트가 고정되어 있다면 어떤 응용을 위해서는 사용되는 품사 태그세트가 너무 적어서 문제가 되고, 반대로 품사태그세트가 너무 많아서 시스템의 수행속도가 중요시되는 응용에서 성능저하의 요인이 되기도 한다. 본 논문에서는 하나의 태깅 시스템의 품사태그세트를 조절할 수 있도록 하여 몇 가지 응용시스템에 맞게 최적화시킬 수 있는 방법론을 제시하고 실험을 통해서 시스템의 성능, 유지보수 및 시스템의 여러 리소스 관리 측면에서도 가장 효율적인 방법론임을 입증하고자 한다.

Keywords