한중 기계번역 시스템을 위한 동사구 패턴 반자동 확장 방안 연구

A Study on Semi-Automatic Construction of Verb Patterns for a Korean-Chinese MT System

  • 홍문표 (언어처리연구팀, 음성/언어정보연구센터, 한국전자통신연구원) ;
  • 류철 (언어처리연구팀, 음성/언어정보연구센터, 한국전자통신연구원) ;
  • 김영길 (언어처리연구팀, 음성/언어정보연구센터, 한국전자통신연구원) ;
  • 박상규 (언어처리연구팀, 음성/언어정보연구센터, 한국전자통신연구원)
  • Hong, Mun-Pyo (NLP Team, Speech/Language Technology Research Center) ;
  • Ryu, Cheol (NLP Team, Speech/Language Technology Research Center) ;
  • Kim, Young-Kil (NLP Team, Speech/Language Technology Research Center) ;
  • Park, Sang-Kyu (NLP Team, Speech/Language Technology Research Center)
  • 발행 : 2003.10.10

초록

본 논문에서는 한-중 기계번역 시스템에서 사용되는 한중 동사구 패턴의 반자동 생성을 위한 방법론을 제안한다. 한중 동사구 패턴은 한국어와 중국어간의 변환을 위한 정보를 제공할 뿐만 아니라, 한국어의 구문분석과 중국어의 생성을 위해 중요한 정보를 제공하는 고급 언어자원이다. 본 논문에서 제시하는 새로운 패턴 반자동확장 방안은 기존의 한중 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 동사구 패턴을 생성해내는 방법이다. 본 방법론은 시스템 개발 초기에 일반적으로 이루어지는 사전기반 패턴 구축이 끝난 후, 패턴의 커버리지 문제를 해결하기 위해 실용적으로 적용할 수 있는 방법론으로서, 한국어와 중국어 같이 활용 가능한 대역 코퍼스가 아직 많지 않은 경우에 효과적이다. 본 논문에서 제시한 방법론은 실험 결과 67.15%의 정확률과 4.58배의 패턴 확장률을 나타냈다.

키워드