Morphological Processing in an Expanded Dictionary Environment

확장 사전 환경에서의 한국어 형태소 해석과 생성

  • Cho, Young-Hwan (Dept. of Computer Science Korea Advanced Institute of Science and Technology) ;
  • Cha, Hee-Joon (Dept. of Computer Science Korea Advanced Institute of Science and Technology) ;
  • Kim, Gil-Chang (Dept. of Computer Science Korea Advanced Institute of Science and Technology)
  • 조영환 (한국과학기술원 전산학과) ;
  • 차희준 (한국과학기술원 전산학과) ;
  • 김길창 (한국과학기술원 전산학과)
  • Published : 1993.10.08

Abstract

형태소 처리의 기본 원칙은 사전의 표제어를 형태소 수준으로 함으로써 사전의 크기를 줄이고, 중복되는 정보의 양을 최소화하는 것이다. 본 논문에서는 형태소 처리를 위한 여러 환경 요소들 중에서 특별히 확장된 사전 표제어를 기본으로 하는 환경을 제안한다. 확장 사전 환경은 어휘에 대한 사전 표제어와 사전 정보의 분리를 기본으로 한다. 기본 사전 표제어에 대하여 어휘의 활용형을 사전 작성의 후처리인 사전 표제어에 대한 색인구조 구성시에 자동으로 확장함으로써 용언의 불규칙 활용과 음운 축약 현상에 대처한다. 확장 사전 환경의 장점은 형태소 해석과 생성시에 필요한 불규칙 활용에 대한 처리를 사전 확장 시간으로 앞당기고, 어절의 부분문자열과 사전 표제어간의 직접 대응성을 제공하여 여러 응용에 쉽게 적용이 가능하다는 것이다.

Keywords