Korean-English statistical speech translation Using n-best re-ranking

n-best 리랭킹을 이용한 한-영 통계적 음성 번역

  • Lee, Dong-Hyeon (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Lee, Jong-Hoon (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Lee, Gary Geun-Bae (iSoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology)
  • 이동현 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실) ;
  • 이종훈 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실) ;
  • 이근배 (포항공과대학교 컴퓨터공학과 지능소프트웨어연구실)
  • Published : 2006.10.13

Abstract

본 논문에서는 n-best 리랭킹을 이용한 한-영 통계적 음성 번역 시스템에 대해 논하고 있다. 보통의 음성 번역 시스템은 음성 인식 시스템, 자동 번역 시스템, 음성 합성 시스템이 순차적으로 결합되어 있다. 하지만 본 시스템은 음성 인식 오류에 보다 강인한 시스템을 만들기 위해 음성 인식 시스템으로부터 n-best 인식 문장을 추출하여 번역 결과와 함께 리랭킹의 과정을 거친다. 자동 번역 시스템으로 구절기반 통계적 자동 번역 모델을 사용하여, 음성 인식기의 발음 모델에서 기본 단어 단위와 맞추어 번역 모델과 언어 모델을 훈련시킴으로써 음성 번역 시스템에서 형태소 분석기를 제거할 수 있다. 또한 음성 인식 시스템에서 상황 별로 언어 모델을 분리하여 처리함으로써 자동 번역 시스템에 비해 부족한 음성 인식 시스템의 처리 범위를 보완할 수 있었다.

Keywords