Extension and Management of Verb Phrase Patterns based on Lexicon Reconstruction and Target Word Information

사전 재구성과 대역어 정보를 통한 동사구 패턴의 확장 및 관리

  • 홍문표 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 김영길 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 류철 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 최승권 (한국전자통신연구원 휴먼정보처리연구부) ;
  • 박상규 (한국전자통신연구원 휴먼정보처리연구부)
  • Published : 2002.10.11

Abstract

데이터 기반 기계번역의 성공여부는 대량의 데이터를 단기간에 구축하는 방법과, 또 구축된 데이터에 대한 효과적인 관리 방법이 좌우한다고 할 수 있다. 대표적인 데이터 기반 기계번역 방법론인 예제 기반 기계번역 방식이나 패턴 기반 기계번역 방식에서는 최소한의 학습 내지는 학습과정 없이 데이터를 구축하는 데에 연구가 중점적으로 이루어져왔으나, 데이터의 관리 문제에 대해서는 많은 연구가 이루어지지 못하였다. 그러나 데이터의 확장 못지않게 데이터의 효율적인 관리도 데이터 기반 기계번역 시스템의 개발에서 매우 중요하다. 이 논문에서는 사/피동 링크 등을 이용하여 사전을 재구성하는 것이 데이터의 일관성과 관리성을 향상시키고, 이론적인 면에서는 정보 기술상의 잉여성을 줄인다는 점을 보인다. 또한 이러한 정보에 기반하여 기구축된 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 패턴을 만들어내는 방법론도 제시한다.

Keywords