기계번역 성능평가를 위한 핵심어 전달율 측정방안

Evaluation Method of Machine Translation System

  • 유초롱 (한국전자통신연구원 음성/언어기술연구센터) ;
  • 이영직 (한국전자통신연구원 음성/언어기술연구센터) ;
  • 박준 (한국전자통신연구원 음성/언어기술연구센터)
  • Yu, Cho-Rong (Speech/Language Technology Research Center, Electronics and Telecommunications Research Institute) ;
  • Lee, Young-Jik (Speech/Language Technology Research Center, Electronics and Telecommunications Research Institute) ;
  • Park, Jun (Speech/Language Technology Research Center, Electronics and Telecommunications Research Institute)
  • 발행 : 2003.10.10

초록

본 논문은 기계번역 시스템의 성능평가를 위한 '핵심어 전달율 측정' 방안에 대해서 기술한다. 기계번역 시스템의 성능평가는 두 가지 측면으로 고려될 수 있다. 첫 번째는 객관적인 평가로 IBM에서 주창한 BLEU score 측정이나 NIST의 NIST score 측정이 그 예이다. 객관적인 평가는 평가자의 주관적인 판단이나 언어적인 특성을 배제한 방법으로 프로그램을 통해 자동으로 fluency와 adequacy를 측정하여 성능을 평가한다. 다음은 주관적인 평가이다. 주관적인 평가는 평가자의 평가를 통해 번역의 품질을 평가하는 방법이다. 주관적 평가 방법의 대표적인 것으로는 NESPOLE이나 LDC가 있다. 주관적인 평가는 평가자의 정확한 판단으로 신뢰할만한 성능평가 결과를 도출하지만, 시간과 비용이 많이 들고, 재사용할 수 없다는 단점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해, 번역대상 문장에서 핵심어를 추출하고, 그 핵심어가 기계번역 시스템의 수행결과에 전달된 정도를 자동으로 측정하는 새로운 평가방법인 '핵심어 전달율 측정' 방안을 제안한다. 이는 성능평가의 비용과 시간을 절약하고, 주관적 평가와 유사한 신뢰성 있는 평가결과를 얻을 수 있는 좋은 지표가 될 수 있을 것으로 기대한다.

키워드