Korean-English Non-Autoregressive Neural Machine Translation using Word Alignment

단어 정렬을 이용한 한국어-영어 비자기회귀 신경망 기계 번역

  • Jung, Young-Jun (Department of Big Data Medical Convergence, Kangwon National University) ;
  • Lee, Chang-Ki (Department of Big Data Medical Convergence, Kangwon National University)
  • 정영준 (강원대학교 빅데이터메디컬융합학과) ;
  • 이창기 (강원대학교 빅데이터메디컬융합학과)
  • Published : 2021.10.14

Abstract

기계 번역(machine translation)은 자연 언어로 된 텍스트를 다른 언어로 자동 번역 하는 기술로, 최근에는 주로 신경망 기계 번역(Neural Machine Translation) 모델에 대한 연구가 진행되었다. 신경망 기계 번역은 일반적으로 자기회귀(autoregressive) 모델을 이용하며 기계 번역에서 좋은 성능을 보이지만, 병렬화할 수 없어 디코딩 속도가 느린 문제가 있다. 비자기회귀(non-autoregressive) 모델은 단어를 독립적으로 생성하며 병렬 계산이 가능해 자기회귀 모델에 비해 디코딩 속도가 상당히 빠른 장점이 있지만, 멀티모달리티(multimodality) 문제가 발생할 수 있다. 본 논문에서는 단어 정렬(word alignment)을 이용한 비자기회귀 신경망 기계 번역 모델을 제안하고, 제안한 모델을 한국어-영어 기계 번역에 적용하여 단어 정렬 정보가 어순이 다른 언어 간의 번역 성능 개선과 멀티모달리티 문제를 완화하는 데 도움이 됨을 보인다.

Keywords

Acknowledgement

이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No.NRF2021R1F1A106440311, 딥러닝 기반의 한국어 텍스트 스타일 변환 기술 연구). 이 논문은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(No.2013-2-00131, 휴먼 지식 증강 서비스를 위한 지능 진화형 Wise QA 플랫폼 기술 개발).