KTAG99: Highly-Adaptable Koran POS tagging System to New Environments

KTAG99: 새로운 환경에 쉽게 적응하는 한국어 품사 태깅 시스템

  • Kim, Jae-Hoon (Department of Computer Engineering, Korea Maritime University) ;
  • Sun, Choong-Nyoung (Department of Computer Science, Sogang University) ;
  • Hong, Sang-Wook (Department of Computer Science, Sogang University) ;
  • Lee, Song-Wook (Department of Computer Science, Sogang University) ;
  • Seo, Jung-Yun (Department of Computer Science, Sogang University) ;
  • Cho, Jeong-Mi (Human & Computer Interaction Lab., Samsung Advanced Institute of Technology)
  • 김재훈 (한국해양대학교, 컴퓨터공학과) ;
  • 선충녕 (서강대학교, 컴퓨터학과) ;
  • 홍상욱 (서강대학교, 컴퓨터학과) ;
  • 이성욱 (서강대학교, 컴퓨터학과) ;
  • 서정연 (서강대학교, 컴퓨터학과) ;
  • 조정미 (삼성종합기술원 휴먼인터페이스 Lab.)
  • Published : 1999.10.08

Abstract

한국어 정보처리를 위한 언어정보는 응용 분야에 따라 큰 차이를 보인다. 특히 말뭉치를 이용한 연구에서는 언어정보가 달라질 때마다 시스템을 새로 구성해야 하는 어려움이 있다. 본 논문에서는 이와 같은 어려움을 다소 완화시키기 위해 새로운 환경에 잘 적응할 수 있는 한국어 품사 태깅 시스템에 관해서 논한다. 본 논문에서는 이 시스템을 KTAG99라고 칭한다. KTAG99는 크게 실행부와 학습부로 구성되었다. 한국어 품사 태깅을 위한 실행부는 고유명사 추정기, 한국어 형태소 분석기, 통계기반 품사 태거, 품사 태깅 오류교정기로 구성되었으며, 실행부에서 필요한 언어정보를 추출하는 학습부는 고유명사 추정규칙 추출기, 형태소 배열규칙 추출기, 사전 추출기, 확률정보 추정기, 품사 태깅 오류수정 규칙 추정기로 구성되었다. KTAG99에서 필요한 언어정보의 대부분은 학습 말뭉치로부터 추출되거나 추정되기 때문에 아주 짧은 시간 내에 새로운 환경에 적응할 수 있다.

Keywords