Phrase-Pattern-based Korean-to-English Machine Translation System using Two Level Word Selection

두단계 대역어선택 방식을 이용한 구단위 패턴기반 한영 기계번역 시스템

  • Kim, Jung-Jae (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology) ;
  • Park, Jun-Sik (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology) ;
  • Choi, Key-Sun (Department of Computer Science, KORTERM, Korea Advanced Institute of Science and Technology)
  • 김정재 (한국과학기술원 전산학과 전문용어언어공학센터) ;
  • 박준식 (한국과학기술원 전산학과 전문용어언어공학센터) ;
  • 최기선 (한국과학기술원 전산학과 전문용어언어공학센터)
  • Published : 1999.10.08

Abstract

패턴기반기계번역방식은 원시언어패턴과 그에 대한 대역언어패턴들의 쌍을 이용하여 구문분석과 변환을 수행하는 기계번역방식이다. 패턴기반 기계번역방식은 번역할 때 발생하는 애매성을 해소하기 위해 패턴의 길이를 문장단위까지 늘이기 때문에, 패턴의 수가 급증하는 문제점을 가진다. 본 논문에서는 패턴의 단위를 구단위로 한정시킬 때 발생하는 애매성을 해소하는 방법으로 시소러스를 기반으로 한 두단계 대역어 선택 방식을 제안함으로써 효과적으로 애매성을 감소시키면서 패턴의 길이를 줄이는 모델을 제시한다. 두단계 대역어 선택 방식은 원시언어의 한 패턴에 대해 여러 가능한 목적언어의 대역패턴들이 있을 때, 첫 번째 단계에서는 원시언어 내에서의 제약조건에 맞는 몇가지 대역패턴들을 선택하고, 두번째 단계에서는 목적언어 내에서의 제약조건에 가장 적합한 하나의 대역패턴을 선택하는 방식이다. 또한 본 논문에서는 이와 같은 모델에서 패턴의 수가 코퍼스의 증가에 따른 수렴가능성을 논한다.

Keywords