PDMT 번역 방법론에 기반한 대화체 음성 언어 번역 시스템

Spoken language Translation System Based on PDMT

  • 윤승 (한국전자통신연구원, 음성/언어정보연구센터) ;
  • 유초롱 (한국전자통신연구원, 음성/언어정보연구센터) ;
  • 최미란 (한국전자통신연구원, 음성/언어정보연구센터) ;
  • 오승신 (한국전자통신연구원, 음성/언어정보연구센터) ;
  • 박준 (한국전자통신연구원, 음성/언어정보연구센터) ;
  • 이영직 (한국전자통신연구원, 음성/언어정보연구센터)
  • Yun, Seung (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute) ;
  • Yu, Cho-Rong (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute) ;
  • Choi, Mi-Ran (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute) ;
  • Oh, Seung-Shin (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute) ;
  • Park, Jun (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute) ;
  • Lee, Young-Jik (Speech/Language Technology Research Center, Electronics and Telecommunication Research Institute)
  • 발행 : 2003.10.10

초록

ETRI가 참여하고 있는 자동 통역 관련 국제 컨소시엄인 C-STAR에서는 여행자 영역의 대규모 다국어 병렬 말뭉치를 공동으로 구축하였고, 현재 각 기관에서는 이를 이용한 대화체 음성 언어 번역 시스템을 개발 중이다. ETRI에서는 핵심어 처리, 통계정보를 이용하는 구 단위 자동 설정, 설정된 구의 자동대응 및 재배치 등을 특징으로 하는 구 기반 직접 번역 방식(PDMT: Phrase-based Direct Machine Translation)의 번역 방법론을 제안하고 관련 연구를 진행하고 있다. 본 논문에서는 ETRI 대화체 음성 언어 번역 시스템의 구성에 대해 알아보고 PDMT 번역 방법론의 등장 배경과 그 구체적인 번역 방법 및 특징에 대해 자세히 논의하기로 한다.

키워드