Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization

Park, Junsu;Lee, WonKee;Shin, Jaehun;Han, H. Jeung;Lee, Jong-hyeok;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
/
Pages.460-464
/
2019
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

번역 품질 예측을 위한 HTER 분포 평준화 기반 인조 번역 품질 말뭉치 구축 방법

Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization

박준수 (포항공과대학교 컴퓨터공학과) ;
이원기 (포항공과대학교 컴퓨터공학과) ;
신재훈 (포항공과대학교 컴퓨터공학과) ;
한효정 (삼성 리서치) ;
이종혁 (포항공과대학교 컴퓨터공학과)

Park, Junsu (Dept. of Computer Science and Engineering, POSTECH) ;
Lee, WonKee (Dept. of Computer Science and Engineering, POSTECH) ;
Shin, Jaehun (Dept. of Computer Science and Engineering, POSTECH) ;
Han, H. Jeung (Samsung Research) ;
Lee, Jong-hyeok (Dept. of Computer Science and Engineering, POSTECH)

발행 : 2019.10.10

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

번역 품질 예측은 기계번역 시스템이 생성한 번역문의 품질을 정답 번역문을 참고하지 않고 예측하는 과정으로, 번역문의 사후 교정을 위한 번역 오류 검출의 역할을 담당하는 중요한 연구이다. 본 논문은 문장 수준의 번역 품질 예측 문제를 HTER 구간의 분류 문제로 간주하여, 번역 품질 말뭉치의 HTER 분포 불균형으로 인한 성능 제약을 완화하기 위해 인조 사후 교정 말뭉치를 이용하는 방법을 제안하였다. 결과적으로 HTER 분포를 균등하게 조정한 학습 말뭉치가 그렇지 않은 쪽에 비해 번역 품질 예측에 더 효과적인 것을 보였다.

키워드

과제정보

본 연구는 Samsung Research의 지원을 받아 수행한 연구 과제임.

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

번역 품질 예측을 위한 HTER 분포 평준화 기반 인조 번역 품질 말뭉치 구축 방법

Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)