Word Alignment Using Chinese-Korean Linguistic Contrastive Information

중-한 대조분석정보를 이용한 단어정렬

  • Li, Jin-Ji ;
  • Kim, Dong-Il ;
  • Lee, Jong-Hyeok (Department of Computer Science and Engineering, Division of Electrical and Computer Engineering, Pohang University of Science and Technology, and Advanced Information Technology Research Center(AITrc))
  • 리금희 (중국 길림성 연길시 연변과학기술대학교) ;
  • 김동일 (중국 길림성 연길시 연변과학기술대학교) ;
  • 이종혁 (포항공과대학교 전자컴퓨터공학부 컴퓨터공학과, 첨단정보기술 연구센터)
  • Published : 2002.10.11

Abstract

본 논문에서는 범용 병렬코퍼스에서도 적용할 수 있는 단어정렬의 방법을 제안한다. 단어 단위로 정렬된 병렬코퍼스는 자연언어처리의 다양한 분야에 도움을 준다. 예를 들면 변환기반의 기계번역에서 변환패턴의 구축, MWTU(Multi Word Translation Unit)의 자동추출, 사전 구축, 의미 중의성 해소 등 분야에 적용된다. 중한 병렬 코퍼스의 단어정렬은 서로 다른 어족간의 관계의 규명을 포함하고 있기 때문에 본 논문에서는 통계적인 모델보다 중한 대역어 사전, 단일어 시소러스, 품사정보 및 언어학적 대조분석 정보 등 기존에 있는 리소스를 이용하여 재현율과 정확률을 높이는 방법에 대해 제시한다. 성능 평가를 위해 중앙일보에서 임의로 추출한 500개 대응문장을 이용하여 실험한 결과 82.2%의 정확률과 64.8%의 재현율을 보였다.

Keywords