Extraction of English-Korean Compound Noun Translation through Automatic Alignment Method

자동 정렬을 통한 영한 복합어의 역어 추출

  • Lee, Ju-Ho (Dept. of Electrical Engineering & Computer Science/KORTERM/AITrc, KAIST) ;
  • Choi, Key-Sun (Dept. of Electrical Engineering & Computer Science/KORTERM/AITrc, KAIST) ;
  • Lee, Jae-Sung (Dept. of Computer Education, Chungbuk National University)
  • 이주호 (한국과학기술원 전자전산학과, 전문용어언어공학연구센터, 첨단정보기술연구센터) ;
  • 최기선 (한국과학기술원 전자전산학과, 전문용어언어공학연구센터, 첨단정보기술연구센터) ;
  • 이재성 (충북대학교 컴퓨터교육과)
  • Published : 2000.10.13

Abstract

본 논문에서는 양국어로 된 병렬 코퍼스로부터 복합어의 역어를 추출하기 위한 정렬 방법을 제시한다. 여기에서는 개념어에 대한 양국어 공기정보를 사용하여 기본 정렬을 하고, 인접한 개념어로 정렬의 단위를 확장했다. 또한 재추정 기법을 사용하여 대역 확률을 계산함으로써 보다 높은 정확률을 얻을 수 있었다. 본 논문에서 제안한 방법을 적용하여 139,265개의 영어 어절로 이루어진 우루과이 라운드 영한 병렬 코퍼스에 대해서 실험한 결과 2,290개의 대역어 쌍을 얻었고, 그 정확률은 74%였다.

Keywords