Coverage Modeling in Neural Machine Translation using Orthogonal Regularization

Lee, Yo-Han;Kim, Young-Kil;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
/
Pages.561-566
/
2018
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

직교 정규화를 이용한 신경망 기계 번역에서의 커버리지 모델링

Coverage Modeling in Neural Machine Translation using Orthogonal Regularization

이요한 (한국전자통신연구원) ;
김영길 (한국전자통신연구원)

Lee, Yo-Han (Electronics and Telecommunications Research Institute) ;
Kim, Young-Kil (Electronics and Telecommunications Research Institute)

발행 : 2018.10.12

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

최근 신경망 번역 모델에 주의 집중 네트워크가 제안되어 기존의 기계 번역 모델인 규칙 기반 번역 모델, 통계적 번역 모델에 비해 높은 번역 성능을 보이고 있다. 그러나 주의 집중 네트워크가 잘못 모델링되는 경우 과소 번역 현상이 나타난다. 신경망 번역 모델에 커버리지 메커니즘을 추가하여 과소 번역 현상을 완화하는 연구가 진행되었으나 이는 모델의 구조를 변경해야하는 불편함이 있다. 본 논문에서는 신경망 번역 모델의 구조를 변경하지 않고 새로운 손실 함수를 정의하여 과소 번역 현상을 완화하는 방법을 제안한다. 한-영 번역 실험을 통해 제안한 주의 집중 네트워크의 정규화 방법이 커버리지 메커니즘의 목적을 효율적으로 달성함을 보인다.

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

직교 정규화를 이용한 신경망 기계 번역에서의 커버리지 모델링

Coverage Modeling in Neural Machine Translation using Orthogonal Regularization

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)