A Korean Generator using Left-Right Connectivity Information

DaMaN: 좌우접속정보를 이용한 한국어 생성기

  • Chang, Won (Center for Korean Language Engineering / System Engineering Research Institute) ;
  • Yuh, Sang-Hwa (Center for Korean Language Engineering / System Engineering Research Institute) ;
  • Jung, Han-Min (Center for Korean Language Engineering / System Engineering Research Institute) ;
  • Kim, Tae-Wan (Center for Korean Language Engineering / System Engineering Research Institute) ;
  • Hwang, Do-Sam (Center for Korean Language Engineering / System Engineering Research Institute) ;
  • Park, Dong-In (Center for Korean Language Engineering / System Engineering Research Institute)
  • 장원 (국어공학센터 / 시스템공학연구소) ;
  • 여상화 (국어공학센터 / 시스템공학연구소) ;
  • 정한민 (국어공학센터 / 시스템공학연구소) ;
  • 김태완 (국어공학센터 / 시스템공학연구소) ;
  • 황도삼 (국어공학센터 / 시스템공학연구소) ;
  • 박동인 (국어공학센터 / 시스템공학연구소)
  • Published : 1995.10.07

Abstract

기계번역은 대상 언어를 해석하고 변환하여 목적언어의 대역어를 선정한 후, 목적언어를 생성하는 과정을 거친다. 이때, 대상언어의 분석 단위에 따라 대역어의 생성 단위 또는 깊이가 다르다. 그러므로, 특정한 시스템을 위한 생성기는 그 시스템의 해석 또는 변환단계에서 추출되는 대역어에 의존하게 되어 시스템 호환성을 상실한다. 따라서, 중복된 생성기의 개발을 피하기 위하여 번역시스템 특성에 국한되지 않고 독립적으로 이용될 수 있는 한국어 형태소생성기 개발이 필요하다. 본 논문에서는 한국어 해석에 사용되는 한국어 형태소 좌우인접정보를 이용하여 한국어형태소를 생성하는 시스템인 DaMaN을 소개한다. 세분류된 형태소의 활용과 접속, 조사의 변동, 띄어쓰기를 고려한 형태소 좌우접속 정보를 임의 조합 가능한 복합형태 (합성어)에도 적용할 수 있도록 확장하였다. 따라서, 대상언어의 분석단위에 제한 받지 않으므로 시스템 호환성이 있다.

Keywords